Talko - korpus över den talade svenskan i Finland: Korpusbygge i teori och praktik
Södergård, Lisa; Leinonen, Therese (2017)
Södergård, Lisa
Leinonen, Therese
Finska, finskugriska och nordiska institutionen vid Helsingfors universitet
2017
Södergård, Lisa och Leinonen, Therese (2017), Talko - korpus över den talade svenskan i Finland: Korpusbygge i teori och praktik. I: Ideologi, identitet, intervention: Nordisk dialektologi 10 (s. 331-340), red av J.-O. Östman, C. Sandström, P. Gustavsson och L. Södergård. Helsingfors: Finska, finskugriska och nordiska institutionen vid Helsingfors universitet
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe201705036309
https://urn.fi/URN:NBN:fi-fe201705036309
Kuvaus
Artikel i konferenspublikation
Tiivistelmä
I augusti 2014 öppnades den finlandssvenska talspråkskorpusen Talko för användarna. Det primära materialet i korpusen utgörs av ljudfiler men en förutsättning för att materialet ska bli sökbart är att det finns olika former av annotering. Ljudfilerna i Talko har försetts med annotering i form av två olika typer av utskrifter eller transkriptioner. Dessutom har orden i transkriptionen försetts med uppgifter om ordklass. I korpusgränssnittet Glossa sammanförs all information och blir sökbar för korpusanvändaren. I den här studien beskriver vi olika arbetsmoment som har krävts för att utifrån talspråksinspelningar bygga upp en sökbar korpus.