
Höfundar: Iris Edda Nowenstein, Lektor við Háskóla Íslands og talmeinafræðingur á Landspítala

Bryndís Bergþórsdóttir, rannsakandi við Háskóla Íslands og talmeinafræðingur hjá Reykjavíkurborg.
Hvernig gætu tækninýjungar undanfarinna ára, m.a. á sviði gervigreindar, umbylt starfi talmeinafræðinga? Undanfarna mánuði höfum við unnið að því að kortleggja mögulega nýtingu máltæknilausna í starfi talmeinafræðinga, bæði innan Máltækniáætlunar stjórnvalda og verkefnisins Klínísk málsýnagreining sem hlaut styrk úr Samstarfi háskóla 2024. Í þessari grein tökum við saman nokkur dæmi um nýtingu máltæknilausna í samhengi við talmeinafræði og segjum frá þeim verkefnum sem við höfum sjálfar í hyggju að vinna að á næstu árum. Við höfum mikinn áhuga á að heyra hvað talmeinafræðingum finnst liggja mest á og hvetjum lesendur til að hafa samband ef þeir vilja koma athugasemdum og tillögum á framfæri. Í því samhengi er mikilvægt að nefna að lögð er áhersla á tjáskiptatækni, greiningu og eftirfylgd í eftirfarandi umfjöllun, þrátt fyrir að mörg tækifæri séu einnig til staðar þegar kemur að þjálfun.
1 Máltækni og heilbrigðismáltækni
Tal- og máltruflanir hafa áhrif á líf barna og fullorðinna um allan heim. Undanfarin ár hafa orðið hraðar breytingar og framfarir í máltæknirannsóknum og bæði lítil og stór fyrirtæki þróa nú ýmiss konar máltæknilausnir sem gagnast fólki með tal- og máltruflanir. Það eru þá lausnir sem byggja á tölvunarfræðilegri greiningu og framköllun á bæði tali og texta, t.a.m. þegar talgreining er notuð til að breyta töluðu máli í texta og þegar talgerving er notuð til að breyta texta í tal. Undir máltækni falla líka sjálfvirkar leiðréttingar á texta, sjálfvirkar greiningar á breytum eins og fjölda mismunandi orða og svo framköllun máls með spjallmennum, svo dæmi séu tekin. Grundvöllur máltækniframfara eru svokallaðar málheildir (e. corpus), gagnasöfn sem geyma tal og texta. Með auknum tækniframförum hefur orðið sprenging í nýjungum þar sem máltækni er nýtt í heilbrigðiskerfinu, m.a. á sviðum sem snerta starf talmeinafræðinga. Þetta er það sem við höfum viljað kalla heilbrigðismáltækni (e. clinical language technology). Nýjungarnar þegar kemur að greiningartólum og samskiptatækni sem byggja á máltækni eru þó í flestum tilfellum einungis þróaðar fyrir fólk sem talar ensku og örfá önnur stór tungumál. Við viljum breyta þessu og bæta aðgengi þeirra sem tala smærri tungumál eins og íslensku að þjónustu og hjálpartækjum sem byggja á nýjungum í máltækni og gætu aukið lífsgæði og samfélagsþátttöku. Í eftirfarandi umfjöllun eru tekin nokkur dæmi þar sem innleiðing nýrra máltæknilausna lofa góðu. Við byrjum á tólum sem nýtast í tjáskiptatækni og ræðum síðan greiningu og eftirfylgd.
1.2 Skilvirkni tjáskiptakerfa
Tjáskiptatækni, eða óhefðbundnar tjáskiptaleiðir (e. Alternative and Augmentative Communication, AAC) geta verið af ýmsum toga. Oft verða lágtæknilausnir fyrir valinu þar sem þær eru einfaldari, aðgengilegri og ódýrari. Þó henta hátæknilausnir ýmsum og til eru ýmis tjáskiptaforrit sem geta gert einstaklingum með tjáskiptaerfiðleika kleift að tjá sig betur. Á Íslandi er nokkur fjöldi sem nýtir óhefðbundnar tjáskiptaleiðir en á síðustu 10 árum hafa 182 einstaklingar fengið sérhæfð tjáskiptatæki í gegnum Sjúkratryggingar Íslands samkvæmt upplýsingum sem var aflað í gegnum tjáskiptatækniteymi stofnunarinnar. Þar sem samskipti í gegnum tjáskiptatölvur eru mun hægari en hefðbundin málleg samskipti eru tölfræðilíkön nýtt til þess að spá fyrir um næsta eða næstu orð sem getur hraðað á tali um 50% (Trnka o.fl., 2009). Þó er samskiptahraði aðeins um 12-18 orð á mínútu (Waller 2019) sem er mun minna en í hefðbundnu tali. TDSnap kerfið í Tobii Dynavox tölvunum nýtir sem dæmi tölfræðilíkan til að flýta fyrir innslætti. Líkanið byggir á 500.000 setningum úr talmáli og spáir fyrir um næstu orð og orðmyndir út frá því sem þegar hefur verið slegið inn (Tobii Dynavox, 2024). Forritið lærir síðan af þeim skilaboðum sem notandinn býr til og ágiskanir ættu því með tímanum að verða skilvirkari. Sambærileg tækni er til staðar í flestum snjalltækjum. En hvernig væri hægt að bæta slíka tækni enn frekar og laga hana að notendum sem glíma við tal- og máltruflanir sérstaklega?
Nýlega hefur verið meira um rannsóknir á nýtingu risamállíkana til þess að laga tjáskiptakerfi að hverjum einstaklingi. Rannsakendur hafa prófað að þjálfa líkön í því að þekkja skammstafanir í samhengi, sem getur t.a.m. flýtt fyrir tjáningu með augnstýringu eða öðrum leiðum þar sem innsláttur tekur langan tíma (Cai o.fl., 2022). Fleiri þjálfa svo líkön til þess að víkka út segðir út frá einföldu ílagi frá notandanum og leggja þá til flóknari setningu út frá nokkrum stikkorðum. Kerfið myndi þá nýta samræðusamhengi og allar þær upplýsingar sem eru til staðar um samskiptastíl og orðaval einstaklingsins frá fyrri samskiptum og með þeim hætti lágmarka það sem hver einstaklingur þarf að slá inn sjálfur. Dæmi um slíka þróun eru verkefnin KWickChat (Shen o.fl., 2022), Speech Macros (Valencia o.fl., 2023) og Aphasia-GPT (Bailey o.fl., 2024). KwickChat notar GPT-2 mállíkan og býr til setningar út frá örfáum lykilorðum/merkingarbærum orðum sem notandinn slær sjálfur inn. Notandinn velur svo setninguna sem honum þykir best og getur slegið inn allt að 71% minna en þyrfti að gera án stuðnings. Speech-Macros virkar á svipaðan hátt en í því kerfi velur notandi fyrst hvað hann vill að kerfið geri (þ.e. (1) lengi svar, (2) svari með þekktum bakgrunnsupplýsingum eða (3) breyti orðum í beiðni) og uppástungur líkansins verða þá afmarkaðri. Speech Macros var prófað á einstaklingum sem ekki voru með málstol eða skerta hugræna færni heldur áttu eingöngu í erfiðleikum með tal. Aphasia-GPT er hins vegar hugsað fyrir einstaklinga með málstol og virkar á svipaðan hátt og Kwick-Chat. Það nýtir sjálfvirka talgreiningu og sendir beiðnir á GPT3.5 Turbo Instruct líkanið sem skilar þremur tillögum að fullmótaðri segð. Risamállíkön hafa þróast hratt síðustu ár og verða sífellt betri og aðgengilegri fyrir almenna notendur. Slík þróun opnar á ýmsa möguleika fyrir hraðari og einstaklingsmiðaðri samskipti fyrir AAC notendur. Framfarir hafa einnig orðið í getu risamállíkana í íslensku og því engin ástæða til að íslenskan fylgi ekki með í þessari þróun. Það gerist þó ekki af sjálfu sér heldur þarf sérstakar aðgerðir til að lítið málsamfélag eins og íslenska haldi í við þróunina.
1.3 Talgreining
Framfarir í þróun risamállíkana ásamt betra aðgengi að stórum gagnasöfnum hefur leitt af sér aukna nákvæmni í sjálfvirkri talgreiningu á síðustu árum. Miklar framfarir hafa einnig átt sér stað í talgreiningu á íslensku, bæði hjá íslenskum fyrirtækjum (sjá t.d. Tíró og Miðeind) og erlendum stórfyrirtækjum (t.d. Microsoft og Google). Talgreinar eiga þó enn erfitt með að skilja tal ef taltruflanir eru til staðar þar sem líkönin hafa ekki verið þjálfuð með gögnum frá einstaklingum með tal- og máltruflanir. Einnig má gera betur þegar kemur að talgreiningu fyrir íslenskar barnaraddir og raddir fólks sem talar íslensku sem annað mál, en í þeim tilfellum hefur einhverjum gögnum verið safnað innan Máltækniáætlunar stjórnvalda (sjá t.d. Mena o.fl., 2021).
Engin íslensk gagnasöfn eru þó til með upptökum af fólki með tal- og máltruflanir. Þetta er mikilvægt þar sem rannsóknarfólk og fyrirtæki (aðallega í enskumælandi heiminum) hafa nýlega þróað talgreiningarlíkön sem skilja einstaklinga með tal- og máltruflanir en til þess þarf stór gagnasöfn með tali frá einstaklingum sem glíma við slíka erfiðleika. Einstaklingsmiðuð talgreiningarlíkön, sem hafa þá verið fínstillt með gögnum frá notandanum sjálfum, geta bætt nákvæmni til muna. Slíkur persónulegur talgreinir skilur tal betur en fólk sem ekki þekkir notandann. Manneskjan með taltruflunina getur þannig fengið texta fyrir talið sitt í rauntíma og sýnt viðmælandanum. Í sumum tilfellum býður hugbúnaðurinn einnig upp á endurtekningu á setningunni með talgervli og þannig getur viðkomandi notað röddina í aðstæðum þar sem það væri jafnvel annars ekki hægt eða mjög erfitt. Persónuleg talgreining hentar best fyrir einstaklinga með stöðuga taltruflun en þeir einstaklingar sem glíma við hrörnun í tali geta einnig nýtt persónulegt líkan með því að endurstilla það af og til. Nákvæm og áreiðanleg talgreining gerir fólki kleift að gera sig skiljanlegt nær hverjum sem er sem eykur skilvirkni og gæði samskipta auk þess sem það getur aukið sjálfstæði. Einstaklingsmiðuð talgreining getur einnig opnað á möguleikann til þess að nýta raddstýringu, en þar sem stór hluti þessa hóps glímir við hreyfihamlanir auk talerfiðleika getur raddstýring haft jákvæð áhrif á sjálfstæði og lífsgæði. Persónulegt talgreiningarmódel fyrir enskumælandi notendur getur nú verið fínstillt með jafnvel aðeins 3-4 mínútum af talgögnum frá notandanum sjálfum. Alvarleiki taltruflunar hefur þó áhrif á magn gagna sem þarf og á nákvæmni talgreiningar (Shor o.fl., 2019; Tobin og Tomanek, 2021).
1.4 Talgerving
Einstaklingar sem nýta sér talgervingu í samskiptum þurfa oft að tala með rödd sem margir aðrir nota líka en það getur haft mjög neikvæð áhrif á sjálfsmynd fólks. Á Íslandi er úrvalið mjög takmarkað þegar kemur að því að nýta rödd í tjáskiptatölvu og flestallir sem nýta sér talgervil á Íslandi hljóma því eins. Bæði börn og fullorðnir. Í Tobii Dynavox tölvunum, sem nær allir notendur talgervla í tjáskiptatölvum á Íslandi nota, er hægt að nota tvær karlmanns- og kvenmannsraddir (Karl og Dóra frá Amazon og í einhverjum tilfellum Gunnar og Guðrún frá Microsoft). Það eru til fleiri raddir á íslensku en þeir talgervlar sem hafa verið þróaðir á síðustu árum undir Máltækniáætlun stjórnvalda hafa ekki ratað inn í AAC tækin.
Nokkuð mörg erlend fyrirtæki og stofnanir þróa nú persónulega talgervla sem hægt er að nota í tjáskiptatölvum. Sú tækni gerir fólki kleift að nota rödd sem hljómar eins og þeirra eigin rödd með því að taka sig upp áður en taltruflunin verður of mikil. Einnig er hægt að nýta eldri upptökur í sumum tilfellum ef gæðin eru nægileg. Til þess að útbúa persónulegan talgervil er talgervilslíkan, forþjálfað á fjölda radda, fínstillt með gögnum frá notanda. Þessi aðferðafræði gerir það að verkum að notandinn þarf að leggja fram mun minna magn af gögnum en ef líkanið væri þjálfað frá grunni. Sérsniðin eða persónuleg talgerving er í stöðugri þróun og þarfnast sífellt minna af gögnum til þess að geta búið til rödd. Auk þess geta notendur nú tekið upp fyrir raddbanka heima hjá sér eftir leiðbeiningum. Þetta er einstaklega mikilvæg þróun fyrir fólk með hrörnunarsjúkdóma eins og MSA eða MND sem þegar finna fyrir einkennum og geta átt erfitt með að koma sér á milli staða eða tala í lengri tíma.
Í ágúst 2024 opnaði skoska fyrirtækið SpeakUnique fyrir raddbankaþjónustu á íslensku en íslenska er eina tungumálið utan ensku sem SpeakUnique hefur þróað rödd fyrir. Bæði talmeinafræðingar og notendur hafa þegar fengið persónulegan talgervil í hendurnar sem hægt er að nota með Tobii Dynavox og á öllum Microsoft tækjum. Verkefnið er þó enn á tilraunastigi (í samstarfi við okkur í Háskóla Íslands) og mikið svigrúm til bætinga. Þá má nefna að farnar eru af stað viðræður á milli Almannaróms og fyrirtækisins Acapela varðandi persónulega talgervla. Acapela býður upp á slíka þjónustu fyrir 24 önnur tungumál og er auk þess eitt fárra fyrirtækja sem býður upp á barnaraddir. Barnaraddirnar eru þó ekki persónulegar og á færri tungumálum. Persónulegar barnaraddir sem hægt er að nýta á flestum tækjum er hægt að fá á ensku frá fyrirtækinu The VoiceKeeper. Raddirnar koma frá raddgjöfum sem gjarnan eru fjölskyldumeðlimir barnsins sem nýtir svo röddina. Í annarri Máltækniáætlun stjórnvalda á Íslandi er fyrirhugað að safna þeim gögnum sem nauðsynleg eru til að þróa íslenskar barnaraddir. Verkefnin eru því mörg þegar kemur að því að íslensk heilbrigðismáltækni haldi í við þróunina úti og það á einnig við um máltækni í samhengi greiningar og eftirfylgdar með tal- og máltruflunum.
1.5 Greining og eftirfylgd
Með hröðum framförum á sviði sjálfvirkrar tal- og textagreiningar hefur komið í ljós að hægt er að nýta málsýni fólks til að greina fyrstu stig taugahrörnunarsjúkdóma á borð við Alzheimer og MND, þar sem breytingar koma fram í tali og málnotkun. Tæknin hefur m.a. reynst gagnleg til þess að greina einstaklinga með Alzheimersjúkdóm, PPA og MND frá heilbrigðum öldruðum (Fraser o.fl., 2015; Gumus o.fl., 2023; Norel o.fl., 2018; Cho o.fl., 2024). Það hefur líka reynst mögulegt að greina á milli ólíkra undirflokka sjúkdóma svo sem PPA (Fraser o.fl., 2014) og MND (Bowden o.fl., 2023). Sjálfvirk greining á tal- og málþáttum getur gagnast til þess að greina litlar breytingar hjá einstaklingum á byrjunarstigi sjúkdóms sem og hjá einstaklingum sem eiga á hættu að fá hrörnunarsjúkdóm síðar (Nevler o.fl., 2024) og eins er hægt að finna og fylgjast á nákvæman hátt með breytingum á einkennum í tali (Robin o.fl., 2023). Þetta gerir heilbrigðisstarfsfólki kleift að fylgjast með þróun einkenna og sníða lausnir, meðferð og þjálfun að þörfum fólks, auk þess sem málsýnagreiningar nýtast í prófunum á árangri nýrra lyfja og í rannsóknum á erfðaþáttum tals og máls. Þessar nýju aðferðir hafa þann kost að krefjast ekki inngrips og vera í grunninn ódýrar. Dæmi um fyrirtæki sem nota máltækni til þess að sækja mállega þætti og greina sjálfvirkt texta og upptökur af tali eru Winterlight Labs (Robin o.fl., 2023) og Toolkit to Examine Lifelike Language (TELL) appið (García o.fl., 2023). Þessar lausnir leggja áherslu á að greina og fylgjast með taugahrörnun og eru að mörgu leyti sniðnar að þörfum taugalækna og taugasálfræðinga.
Svið taugahrörnunarsjúkdóma hefur verið sérstaklega áberandi í þessu samhengi en einnig er ljóst að sjálfvirk málsýnagreining lofar góðu fyrir skilvirkari þjónustu við börn og fullorðna með tal- og málraskanir af fjölbreyttum toga (MacDonald o.fl., 2021, Klatte o.fl., 2022 og Liu o.fl., 2023). Löng hefð er fyrir því að nýta tækni til þess að greina málsýni barna og til eru lausnir eins og SALT fyrir ensku. Þegar kemur að klínískum lausnum sem miða að málsýnum barna er þó lítið um að nýjustu máltæknilausnir séu nýttar þrátt fyrir lengri hefð. SALT Software, ein þekktasta þjónusta fyrir málsýnagreiningu á barnamáli í Bandaríkjunum, byggir t.a.m. að hluta á handavinnu og að hluta á máltækni en málsýni eru öll rituð upp handvirkt (þrátt fyrir miklar framfarir í talgreiningarlíkönum) og svo greind að miklu leyti sjálfvirkt. Tækniyfirfærslan til talmeinafræðinga er enn minni þegar kemur að smærri tungumálum eins og íslensku, og því viljum við reyna að breyta.
2 Málsýnagreining með máltækni á Íslandi
2.1 Vandinn
Líkt og við minntumst á hér á undan hefur þróun á klínískum máltæknilausnum verið bundin við stærri málsamfélög (García o.fl., 2023), þá aðallega ensku, og engin lausn er til sem tekur sérstaklega mið af smærri málsamfélögum. Í tilfelli Íslands, en líka annarra smærri málsamfélaga, er þörfin á tækniþróun á þessu sviði því mikil. Aðstæðum í íslensku heilbrigðiskerfi verður ekki mætt með enskum máltæknilausnum einum og sér og til lengri tíma litið getur íslenskt málsamfélag dregist verulega aftur úr í þróun og nýtingu máltæknilausna í heilbrigðisþjónustu. Við þá vinnu að rannsaka klínískar máltæknilausnir til greiningar og eftirfylgdar höfum við ekki rekist á heildræna lausn fyrir talmeinafræðinga, jafnvel þó þeir séu helstu sérfræðingar þegar kemur að einkennum í tali og máli og þeir sérfræðingar sem helst nýta málsýni í sinni vinnu. Greiningartæki sem byggja á máltækni beinast flest að taugasjúkdómum en sem talmeinafræðingar sinnum við fjölbreyttari hópi, s.s. einstaklingum með tal- eða málraskanir í kjölfar heilablóðfalls og börnum með málþroskaraskanir. Auk þess eru málsýni eitt nákvæmasta tólið til þess að greina ýmis smáatriði í málnotkun einstaklinga sem önnur tæki á borð við stöðluð próf grípa ekki. Þetta er sérstaklega mikilvægt þegar kemur að því að greina málþroskaröskun hjá fjöltyngdum börnum, en reynst hefur einstaklega erfitt að þróa áreiðanlegar mælingar á málþroska þeirra.
Loks má nefna að þrátt fyrir ýmsar tækninýjungar er oft ekki skýrt hvernig heilbrigðisstarfsmenn geta beitt þessari nýju tækni í eigin starfi auk þess sem talsvert vantar upp á í nýtingu máltækni í beina þágu klínískra hópa. Til þess þarf betri gögn, jafnvel í þeim málsamfélögum sem hafa náð hvað lengst. Bandaríkin hafa staðið framarlega þegar kemur að heilbrigðismáltækni og hafa nýlega farið af stað tvö stór átaksverkefni, annað drifið áfram af einkageiranum (Speech Accessibility Project) og hitt af opinbera heilbrigðiskerfinu (Bridge2AI Voice), þar sem ráðist hefur verið í umfangsmiklar gagnasafnanir eins og minnst var á ofar. Því er skýrt að smærri málsamfélög þurfa einnig að huga að gagnasöfnun til að dragast ekki enn frekar aftur úr.
2.2 Lausnin
Til þess að mæta þessum þörfum höfum við verið að þróa áfram hugmynd um sjálfvirka málsýnagreiningu sem miðar að þörfum talmeinafræðinga sem starfa í smærri málsamfélögum eins og á Íslandi. Verkefnið hefur hlotið heitið ALDA sem stendur fyrir Automatic Linguistic Data Analysis (sjálfvirk málfræðileg gagnagreining). Markmið ÖLDU er að vinna að jöfnu aðgengi fólks að nýrri stafrænni heilbrigðistækni óháð tungumáli. Það viljum við gera með því að nýta íslenskar máltækniafurðir til að þróa heildstætt greiningartæki sem nær bæði til málsýna fullorðinna og barna. Greiningartækið er í formi öruggrar veflausnar sem ber vinnuheitið Klínísk málsýnagreining (e. Clinical Analysis of Language Samples, CALS). Með okkur tveimur í verkefninu eru tveir sérfræðingar í máltækni, Gunnar Thor Örnólfsson og Hinrik Hafsteinsson.
Fyrsta útgáfa lausnarinnar mun greina textaskjal með uppskrifuðu málsýni eða hljóðupptöku af málsýni. Upptaka verður þá skrifuð upp með sjálfvirkri talgreiningu og lagfærð handvirkt af talmeinafræðingi. Þá er málsýnið greint sjálfvirkt og lykilupplýsingar birtar á skýran og læsilegan hátt (sjá mynd 1). Með tímanum verður lausnin þróuð á þann hátt að hægt sé að greina málsýni á fleiri tungumálum og þar með fá betri upplýsingar um málnotkun fjöltyngdra einstaklinga.

Mynd 1. ALDA: Klínísk málsýnagreining.

Með sjálfvirkri greiningu er það okkar von að talmeinafræðingar hafi þá frekar tíma til þess að taka endurtekin málsýni sem veita skýra yfirsýn yfir árangur í meðferð og þróun einkenna. Í samstarfi við talmeinafræðinga og fræðimenn á sviði tal- og málraskana viljum við svo nýta veflausnina til þess að safna gögnum og byggja upp Íslenska málsýnabankann, þar sem við myndum byggja á nokkuð langri hefð málsýnasöfnunar á Íslandi þar sem Jóhanna T. Einarsdóttir hefur rutt veginn. Vel uppbyggður málsýnabanki verður ómetanleg uppspretta þekkingar á birtingarmyndum sjúkdóma og raskana í máli. Gögnin munu líka vonandi nýtast til að þróa lausnina m.a. með bættri talgreiningu fyrir truflað tal og barnaraddir. Auk þess mun gott gagnasafn nýtast til þess að þróa og bæta aðrar máltæknilausnir sem auka skilvirkni og nákvæmni greiningarvinnu og svo sérhæfð tjáskiptaforrit sem geta aukið lífsgæði og eflt fólk með skerta talgetu til þátttöku í samfélaginu (mynd 2).

Mynd 2. Tengsl Klínískrar málsýnagreiningar við Íslenska málsýnabankann og aðrar afleiddar afurðir.
Eins og er er ekki til nein málheild með gögnum sem mögulegt er að nýta í rannsóknir og þróun. Málhafar íslensku eru fáir og eru t.a.m. einungis um 20-30 manns á Íslandi með MND á hverjum tímapunkti. Til þess að safna nýtilegu magni gagna í slíka málheild er því nauðsynlegt að hefjast handa strax, og við teljum að lykilatriði í þróun heilbrigðismáltæknilausna á Íslandi sé að fá starfandi talmeinafræðinga til liðs við okkur. Þróun á veflausninni er þegar hafin og við stefnum að því að hún verði nothæf í einhverri mynd á þessu ári (2025). Við biðjum því ykkur sem hafið áhuga á því að taka þátt í þróuninni með því að prófa lausnina að hafa samband við okkur. Við viljum þróa nothæft tæki fyrir talmeinafræðinga og það verður ekki gert án víðtæks samráðs við stéttina.
Höfundar greinarinnar eru: Iris Edda Nowenstein, Lektor við Háskóla Íslands og talmeinafræðingur á Landspítala, og Bryndís Bergþórsdóttir, rannsakandi við Háskóla Íslands og talmeinafræðingur hjá Reykjavíkurborg.
Heimildir
Bailey, D. J., Herget, F., Hansen, D., Burton, F., Pitt, G., Harmon, T. og Wingate, D. (2024). Generative AI applied to AAC for aphasia: a pilot study of Aphasia-GPT. Aphasiology, 1–16. https://doi.org/10.1080/02687038.2024.2445663
Bowden, M., Beswick, E., Tam, J. o.fl. (2023). A systematic review and narrative analysis of digital speech biomarkers in Motor Neuron Disease. npj Digital Medicine, 6, 228. https://doi.org/10.1038/s41746-023-00959-9
Cai, S., Venugopalan, S., Seaver, K., Xiao, X., Tomanek, K., Jalasutram, S., Morris, M. R., Kane, S., Narayanan, A., MacDonald, R. L., Kornman, E., Vance, D., Casey, B., Gleason, S. M., Nelson, P. Q. og Brenner, M. P. (2023). Using large language models to accelerate communication for users with severe motor impairments. arXiv. https://doi.org/10.48550/arXiv.2312.01532
Cho, S., Olm, C. A., Ash, S., Shellikeri, S., Agmon, G., Cousins, K. A. Q., Irwin, D. J., Grossman, M., Liberman, M.og Nevler, N. (2024). Automatic classification of AD pathology in FTD phenotypes using natural speech. Alzheimer’s & Dementia, 20(5), 3416–3428. https://doi.org/10.1002/alz.13748
Fraser, K. C., Meltzer, J. A., Graham, N. L., Leonard, C., Hirst, G., Black, S. E. og Rochon, E. (2014). Automated classification of primary progressive aphasia subtypes from narrative speech transcripts. Cortex, 55, 43-60. https://doi.org/10.1016/j.cortex.2012.12.006
Fraser, K. C., Meltzer, J. A.og Rudzicz, F. (2015). Linguistic features identify Alzheimer’s disease in narrative speech. Journal of Alzheimer’s Disease, 49(2), 407–422. https://doi.org/10.3233/jad-150520
García, A. M., Johann, F., Echegoyen, R., Calcaterra, C., Riera, P., Belloli, L. og Carrillo, F. (2023). Toolkit to Examine Lifelike Language (TELL): An app to capture speech and language markers of neurodegeneration. Behavior Research Methods, 56(4), 2886–2900. https://doi.org/10.3758/s13428-023-02240-z
Gumus, M., Koo, M., Bhan, A., Robin, J. og Black, S. E. (2023). Speech changes in neurodegenerative diseases relate to clinical outcomes. Alzheimer’s & Dementia, 19(S18), e072857. https://doi.org/10.1002/alz.072857
Klatte, I. S., van Heugten, V., Zwitserlood, R. og Gerrits, E. (2022). Language sample analysis in clinical practice: Speech-language pathologists’ barriers, facilitators, and needs. Language, Speech, and Hearing Services in Schools, 53(1), 1–16. https://doi.org/10.1044/2021_LSHSS-21-00026
Liu, H., MacWhinney, B., Fromm, D. og Lanzi, A. (2023). Automation of language sample analysis. Journal of Speech, Language, and Hearing Research, 66(7), 2421–2433.
MacDonald, R. L., Jiang, P.-P., Cattiau, J., Heywood, R., Cave, R., Seaver, K., Ladewig, M. A., Tobin, J., Brenner, M. P., Nelson, P. C., Green, J. R. og Tomanek, K. (2021). Disordered speech data collection: Lessons learned at 1 million utterances from Project Euphonia. Interspeech 2021. https://doi.org/10.21437/interspeech.2021-697
Mena, C., Borsky, M., Mollberg, D. E., Guðmundsson, S. F., Hedström, S., Pálsson, R., Jónsson, Ó. H., Þorsteinsdóttir, S., Guðmundsdóttir, J. V., Magnúsdóttir, E. H., Þórhallsdóttir, R. og Gudnason, J. (2021). Samrómur Children 21.09 [Audio corpus]. Reykjavík University. http://hdl.handle.net/20.500.12537/185
Nevler, N., Cho, S., Cousins, K. A., Ash, S., Olm, C. A., Shellikeri, S., … og Grossman, M. (2024). Changes in digital speech measures in asymptomatic carriers of pathogenic variants associated with frontotemporal degeneration. Neurology, 102(2), e207926. https://doi.org/10.1212/wnl.0000000000207926
Norel, R., Pietrowicz, M., Agurto, C., Rishoni, S. og Cecchi, G. (2018). Detection of Amyotrophic Lateral Sclerosis (ALS) via Acoustic Analysis. bioRxiv, 383414. https://doi.org/10.1101/383414
Robin, J., Xu, M., Balagopalan, A., Novikova, J., Kahn, L., Oday, A., … og Teng, E. (2023). Automated detection of progressive speech changes in early Alzheimer’s disease. Alzheimer’s & Dementia: Diagnosis, Assessment & Disease Monitoring, 15(2), e12445. https://doi.org/10.1002/dad2.12445
Shen, J., Yang, B., Dudley, J. J. og Kristensson, P. O. (2022). KWickChat: A multi-turn dialogue system for AAC using context-aware sentence generation by bag-of-keywords. Proceedings of the 27th International Conference on Intelligent User Interfaces, 853–867. https://doi.org/10.1145/3490099.3511145
Shor, J., Emanuel, D., Lang, O., Tuval, O., Brenner, M., Cattiau, J., Vieira, F., McNally, M., Charbonneau, T., Nollstadt, M., Hassidim, A. og Matias, Y. (2019). Personalizing ASR for dysarthric and accented speech with limited data. arXiv. https://doi.org/10.48550/arXiv.1907.13511
Tobii Dynavox. (2024). TD Snap user guide. Tobii Dynavox. https://www.tobiidynavox.com
Tobin, J. og Tomanek, K. (2022). Personalized automatic speech recognition trained on small disordered speech datasets. ICASSP 2022 – 2022. https://doi.org/10.1109/icassp43922.2022.9747516
Trnka, K., McCaw, J., Yarrington, D., McCoy, K. F. og Pennington, C. (2009). User interaction with word prediction: The effects of prediction quality. ACM Transactions on Accessible Computing, 1(3), Article 17. https://doi.org/10.1145/1497302.1497307
Valencia, S., Cave, R., Kallarackal, K., Seaver, K., Terry, M. og Kane, S. K. (2023). “The less I type, the better”: How AI language models can enhance or impede communication for AAC Users. Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems, 1–14. https://doi.org/10.1145/3544548.3581560
Waller, A. (2019). Telling tales: unlocking the potential of AAC technologies. International journal of language & communication disorders, 54(2), 159-169. https://doi.org/10.1111/1460-6984.12449