Ressurser

Oversikt over ressurser tilknyttet forskergruppen.

Talebanken

Om talebanken

Talebanken er eit arkiv for lydfiler fr氓 (i hovudsak) norsk talem氓l og eit korpus av lydfiler kopla med transkripsjon.

Korpuset Talebanken er utvikla teknisk av Uni Research Computing med tanke p氓氓 effektivisere analysar og 氓 gjera analysane sikrare. Materialet i korpuset er lagt inn i samband med tidlegare sosiolingvistiske talem氓lsstudiar. Det er tanken at materialet inklusiv kodingar skal kunna gjenbrukast i nye prosjekt.

B氓de lydarkivet og korpuset er etablerte med tanke p氓 forskingsform氓l, og derfor er tilgangen avgrensa til forskarar med l酶yve. Interesserte kan kontakta Ragnhild Lie Anderson.

脜rsmeldingar for Talebanken

脜rsmelding 2022/2023

Talebanken er eit digitalt forskingsarkiv (korpus) av talem氓l som ligg p氓 den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for f忙r酶ysk. Det st酶rste delkorpuset, Dialektendringsprosessar, er no p氓 4,6 millionar ord. Hausten 2023 kom det inn end氓 eit nytt delmateriale fr氓 Sogndal (opptak med 36 informantar fr氓 1996). I tillegg ligg det inne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i 罢补濒别蝉酶办, som kan sj氓ast p氓 som eit depot fr氓 tidlegare granskingar f酶r ein begynte med desse digitale korpusa.

Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske milj酶et ved LLE, er ogs氓 i 2022 og 2023 blitt brukt aktivt av forskarar. Materiala fr氓 desse korpusa kjem ogs氓 andre akt酶rar til gode.

Revisjonsprosjektet nyttar dette materialet i s酶ka sine for Nynorskordboka og Bokm氓lsordboka. Talebanken er ogs氓 eit verdifullt kjeldemateriale for Norsk Ordbok (NO), men er enno ikkje teke i bruk i redigeringa av ordboka. F酶r ein kan gjere det m氓 NO f氓 nytt redigeringsgrensesnitt, og det m氓 lagast ei integrert l酶ysing for bruk av talem氓lsmateriale. Det nye grensesnittet skulle ha vore utvikla i 2022, men arbeidet er ikkje gjennomf酶rt p氓 grunn av personalmangel. Status for bruk av Talebanken i redigeringa av Norsk Ordbok er derfor den same som ved 氓rsskiftet 2021/2022, og det er uklart kva tid dei tekniske l酶ysingane vil vera p氓 plass.

Me fekk i 2022 tildelt 23 214 kr for at Bente Selback skulle leggja til rette for at lydfiler som tidlegare h酶yrde til i Spr氓ksamlingane, kan leggjast inn i Talebanken. Metafila vart d氓 ferdig for dei utvalde filene for 脜mli, Austevoll, Stord, Aukra, Fr忙na, Molde, Rauma, Sand酶y, Midsund, Haugesund og F酶rde. Dessutan vart arbeidet med B酶mlo og Flakstad starta, men her er det s氓 langt berre laga skjema, og ikkje f氓tt skrive inn i metafila.

Ogs氓 i 2023 s酶kte me b氓de til instituttet og til Meltzer om midlar til 氓 leggja inn meir materiale, men d氓 fekk me diverre avslag begge stader.

10.01.2024

Ragnhild Lie Anderson

脜rsmelding 2021

Talebanken er eit digitalt forskingsarkiv (korpus) av talem氓l som ligg p氓 den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for f忙r酶ysk. Det st酶rste delkorpuset, Dialektendringsprosessar, er p氓 ca. 4,5 millionar ord. I tillegg ligg det inne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i 罢补濒别蝉酶办, som kan sj氓ast p氓
som eit depot fr氓 tidlegare granskingar f酶r ein begynte med desse digitale korpusa. Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske milj酶et ved LLE, er ogs氓 i 2021 blitt brukt aktivt av forskarar. Materiala fr氓 desse korpusa kjem ogs氓
andre akt酶rar til gode. I 2021 er det blant anna kome til b氓de ein ekstern og ein intern masterstudent som nyttar seg av denne ressursen i tillegg til stipendiatar og fast tilsette.

Revisjonsprosjektet nyttar dette materialet i s酶ka sine for Nynorskordboka og Bokm氓lsordboka. Norsk Ordbok signerte i 氓r ein avtale om 氓 nytta dette talem氓lskorpuset som ei verdifull digital tekstsamling for 氓 gje dei talem氓lsgrunnlag for s酶ka sine. Me fekk i 2021 tildelt
33 034 kr for at Bente Selback skulle leggja til rette for at lydfiler som tidlegare h酶yrde til i Spr氓ksamlingane, kan leggjast inn i Talebanken og for utf酶ring av teknisk arbeid med banken av Paul Meurer. Det er s氓leis blitt jobba med metafiler i 90 nye filer (脜mli, Austevoll, Stord, Aukra, Fr忙na, Molde, Rauma, Sand酶y, Midsund, Haugesund og F酶rde), og 221 nye postar (knytte til informantar og intervjuarar) er gjort klare.

Me vil ogs氓 i 2022 s酶kja om midlar for 氓 halda fram dette arbeidet og 酶nskjer 氓 f氓 lagt inn nye lydfiler i Talebanken slik at han vert eit end氓 meir verdifullt talem氓lskorpus. N氓r dette materialet er innlagt, tek me sikte p氓氓 invitera forskarar til 氓 bruka Talebanken og koma saman til eit forskarseminar som kan visa fram Talebanken som nasjonal forskingsresurs.

23.01.2022

Ragnhild Lie Anderson

脜rsmelding 2020

Talebanken er eit digitalt forskingsarkiv (korpus) av talem氓l som ligg p氓 den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for f忙r酶ysk. Det st酶rste delkorpuset, Dialektendringsprosessar, er no kome opp i nesten 4,5 millionar ord. Det siste som kom inn her i2020, var stipendiat Per Sigmund S忙vik B酶e sitt materiale p氓 163 449 ord fr氓 Lind氓s. I tillegg ligg detinne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i 罢补濒别蝉酶办, som kansj氓ast p氓 som eit depot fr氓 tidlegare granskingar f酶r ein begynte med desse digitale korpusa. Tankener at materiale fr氓罢补濒别蝉酶办 p氓 sikt ogs氓 kan leggjast inn i eitt av dei to andre delkorpusa og bli likebrukarvenleg.

Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske milj酶et ved LLE, bliri dag brukt aktivt av forskarar. Materiala fr氓 desse korpusa kjem ogs氓 andre akt酶rar til gode. I hausthar t.d. Marta Gjernes f氓tt lesetilgang til materiale fr氓 Industristadprosjektet n氓r ho skal skriva bokom Odda kommune.

Dessutan nyttar revisjonsprosjektet dette materialet i s酶ka sine for Nynorskordboka ogBokm氓lsordboka. Det vil ogs氓 bli inng氓tt ein avtale om bruk av Talebanken med Norsk Ordbok v氓ren2021. Det er d氓 blant anna meininga at redakt酶rane skal f氓 tilgang til transkripsjonar, lydopptak,氓rstal for opptak og dialekt/subdialekt for 氓 kunna laga koplingar mellom ord og bakgrunn p氓ordseddelen.

Me fekk i 2020 tildelt 19 500 kr fr氓 instituttet i driftsmidlar, og desse kronene blei brukte till酶nsutgifter til to studentar og ein forskar for 氓 tilretteleggja og transkribera ein del opptak fr氓Brattv氓gen som vart samla inn i 2005.Det vart halde eit m酶te 27. november hausten 2020 mellom professor emeritus Helge Sand酶y,postdoktor Randi Neteland, stipendiat Per Sigmund S忙vik B酶e og f酶rsteamanuensis Ragnhild LieAnderson og senioringeni酶r Paul Meurer der ein planla vidare utvikling av Talebanken. Ein konkretplan er 氓 f氓 i stand eit nasjonalt seminar der forskarar vert inviterte til 氓 demonstrera bruk avTalebanken.

Postdoktor Randi Neteland har nyleg f氓tt laga ei oppdatert brukarrettleiing til Talebanken.

06.02.2021

Ragnhild Lie Anderson

脜rsmelding 2019

Talebanken ligg p氓 den felles plattforma under Clarino.

Sj酶lve Talebanken er eit digitalt forskingsarkiv (korpus) som veks fr氓氓r til 氓r. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 4,2 millionar ord, Industristadprosjektet (Spr氓kutvikling p氓 industristader) som har om lag 1,8 millionar ord og 罢补濒别蝉酶办 p氓 om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for f忙r酶ysk i samarbeid med Fr贸冒skaparsetur F酶roya: F酶royskur talum谩lsbanki p氓 sirka 470 000 ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske milj酶et ved LLE, og her er talem氓lstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske s酶k ut fr氓 leksikalske, morfologiske eller fonologiske annotasjonar. B氓de masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for 氓 kunna gjera sosiolingvistiske annotasjonar og f氓 ut statistisk distribusjonsanalyse av materialet. Ogs氓 andre forskarar kan f氓 tilgang gjennom s酶knad.

I 氓r er det kome til eit nytt materiale fr氓 Laksev氓g, eit fr氓 Karm酶y (master) og eit materiale med to ungdomskull fr氓 Sogndal (forskar). Det er no to phd-kandidatar og to nye masterstudentar ved LLE som vil bruka banken i arbeidet sitt. I tillegg er det kome til nokre nye interne og eksterne forskarar. I 氓r begynte ogs氓 staben ved Norsk Ordbok 氓 bruka Talebanken i s酶ka sine.

Me fekk i 2019 tildelt 50 000 kroner fr氓 sm氓forsk. Denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar. Det var ogs氓 meininga at Clarino ved Paul Meurer skulle gjera arbeid for 氓 vidareutvikla banken, men det ser ut til at dei har gl酶ymt 氓 senda faktura for dette arbeidet til instituttet.

Den 25. og 26. januar 2019 var det eit seminar ved LLE der me utveksla r酶ynsler saman med F酶royskur talum谩lsbanki. Fleire hadde innlegg og demonstrerte korleis Talebanken verkar, og det vart diskutert korleis denne banken kan utnyttast og vidareutviklast. Hausten 2020 planlegg me eit internt seminar for 氓 demonstrera korleis Talebanken har blitt og kan bli nytta.

02.03.2020

Ragnhild Lie Anderson

脜rsmelding 2018

Talebanken ligg no i den felles plattforma under Clarino.

Sj酶lve Talebanken er eit digitalt forskingsarkiv (korpus) som veks fr氓氓r til 氓r. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 3,8 millionar ord, Industristadprosjektet (Spr氓kutvikling p氓 industristader) som har om lag 1,8 millionar ord og 罢补濒别蝉酶办 p氓 om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for f忙r酶ysk i samarbeid med Fr贸冒skaparsetur F酶roya: F酶royskur talum谩lsbanki. Det blir ved utgangen av 氓ret p氓 sirka 1 mill. ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske milj酶et ved LLE, og her er talem氓lstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske s酶k ut fr氓 leksikalske, morfologiske eller fonologiske annotasjonar. B氓de masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for 氓 kunna gjera sosiolingvistiske annotasjonar og f氓 ut statistisk distribusjonsanalyse av materialet. Ogs氓 andre forskarar kan f氓 tilgang gjennom s酶knad.

I 氓r er det kome til eit nytt materiale fr氓 Laksev氓g-bydel i Bergen, og ein masterstudent har levert avhandling (Lista) basert p氓 innlagt materiale i banken. Neste 氓r ventar me inn nytt materiale fr氓 Karm酶y (master), Sogndal (forskar) og Lind氓s (phd). Det er no to phd-kandidatar og tre masterstudentar ved LLE som bruker banken i arbeidet sitt. I tillegg kjem andre forskarar.

Me fekk i 氓r Ida Torkildsen til 氓 teikna ein ny og fin logo til oss.

I samband med ein s酶knad om eit tverrfagleg forskingsprosjekt der Talebanken ville inng氓, fekk me i 2018 tildelt 50 000 kroner til HF-forsk. Noko av denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar.

Den 25. og 26. januar 2019 vil det bli skipa til eit seminar her ved LLE der me vil utveksla r酶ynsler saman med F酶royskur talum谩lsbanki, og me skal demonstrera korleis Talebanken verkar, kan utnyttast og vidareutviklast.

21.12.2018

Ragnhild Lie Anderson

惭氓濒蹿酶谤别蝉补尘濒颈苍驳补

Om 惭氓濒蹿酶谤别蝉补尘濒颈苍驳补

惭氓濒蹿酶谤别蝉补尘濒颈苍驳补 er eit arkiv med talem氓lsmateriale fr氓 ulike delar av landet, men mest fr氓 Vestlandet.

惭氓濒蹿酶谤别蝉补尘濒颈苍驳补 ved 黑料吃瓜资源 g氓r tilbake til Folkeminnesamlingi ved Bergens Museum, som blei grunnlagd av professor Torleiv Hannaas i 1921. Ho inneheld f酶rst og fremst materiale fr氓 Vestlandet, det vil seie dei fire fylka Rogaland, Hordaland, Sogn og Fjordane og M酶re og Romsdal. Samlinga har blitt tilf酶rt materiale jamt og trutt fr氓 starten av, men typen materiale har endra seg med den teknologiske utviklinga. Medan dei tidlege samlingane i stor grad var handskrivne oppskrifter av ymse slag, er det i dag i stor grad digitaliserte og transkriberte lydopptak som blir lagde inn i arkivet.

I dag omfattar oppskriftene sirka 10 000 sider med opplysningar og dialektanalysar; her er ordsamlingar p氓 i alt 428 000 ord, og lydopptaka utgjer sirka 2000 timar fr氓 tidleg p氓 1950-talet til v氓r tid.

Mykje av materialet er komme inn i samband med systematiske innsamlingsprosjekt, b氓de slike 惭氓濒蹿酶谤别蝉补尘濒颈苍驳补 har arrangert, og slike masterstudentar og doktorgradsstipendiatar har gjennomf酶rt i samband med avhandlingsarbeida sine. Dei siste 氓ra har mykje materiale komme inn fr氓 to NFR-finansierte prosjekt, og .

Fr氓 1.1.2014 er arkivet p氓 vegner av LLE ansvarleg for 黑料吃瓜资源 sitt bidrag til det NFR-finansierte prosjektet Language Infrastructure made Accessible (LIA), der m氓let er 氓 bygge opp ein forskingsressurs som gjer alle talem氓lsressursar i Noreg tilgjengelege innanfor ein struktur.

LIA

Om LIA

LIA (Language Infrastructure made Accessible) er eit fem氓rig nasjonalt samarbeidsprosjekt mellom fire universitet (UiO, 黑料吃瓜资源, UiT og NTNU), Norsk Ordbok 2014 og Nasjonalbiblioteket. Hovudm氓let for prosjektet er 氓 redde gamle talem氓lsopptak med norsk og samisk spr氓k, transkribere og annotere dei og leggje dei inn i databasar slik at dei kan revitaliserast som verdifullt forskingsmateriale. Prosjektleiinga ligg ved Tekstlaboratoriet ved Universitetet i Oslo.

Sist oppdatert: 13.08.2025