ºÚÁϳԹÏ×ÊÔ´

Ressurser

Oversikt over ressurser tilknyttet forskergruppen.

Talebanken

Om talebanken

Talebanken er eit arkiv for lydfiler frÃ¥ (i hovudsak) norsk talemÃ¥l og eit korpus av lydfiler kopla med transkripsjon.

Korpuset Talebanken er utvikla teknisk av Uni Research Computing med tanke på å effektivisere analysar og å gjera analysane sikrare. Materialet i korpuset er lagt inn i samband med tidlegare sosiolingvistiske talemålsstudiar. Det er tanken at materialet inklusiv kodingar skal kunna gjenbrukast i nye prosjekt.

Både lydarkivet og korpuset er etablerte med tanke på forskingsformål, og derfor er tilgangen avgrensa til forskarar med løyve. Interesserte kan kontakta Ragnhild Lie Anderson.

Ã…rsmeldingar for Talebanken

Ã…rsmelding 2022/2023

Talebanken er eit digitalt forskingsarkiv (korpus) av talemål som ligg på den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for færøysk. Det største delkorpuset, Dialektendringsprosessar, er no pÃ¥ 4,6 millionar ord. Hausten 2023 kom det inn endÃ¥ eit nytt delmateriale frÃ¥ Sogndal (opptak med 36 informantar frÃ¥ 1996). I tillegg ligg det inne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i °Õ²¹±ô±ð²õø°ì, som kan sjÃ¥ast pÃ¥ som eit depot frÃ¥ tidlegare granskingar før ein begynte med desse digitale korpusa.

Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, er også i 2022 og 2023 blitt brukt aktivt av forskarar. Materiala frå desse korpusa kjem også andre aktørar til gode.

Revisjonsprosjektet nyttar dette materialet i søka sine for Nynorskordboka og Bokmålsordboka. Talebanken er også eit verdifullt kjeldemateriale for Norsk Ordbok (NO), men er enno ikkje teke i bruk i redigeringa av ordboka. Før ein kan gjere det må NO få nytt redigeringsgrensesnitt, og det må lagast ei integrert løysing for bruk av talemålsmateriale. Det nye grensesnittet skulle ha vore utvikla i 2022, men arbeidet er ikkje gjennomført på grunn av personalmangel. Status for bruk av Talebanken i redigeringa av Norsk Ordbok er derfor den same som ved årsskiftet 2021/2022, og det er uklart kva tid dei tekniske løysingane vil vera på plass.

Me fekk i 2022 tildelt 23 214 kr for at Bente Selback skulle leggja til rette for at lydfiler som tidlegare høyrde til i Språksamlingane, kan leggjast inn i Talebanken. Metafila vart då ferdig for dei utvalde filene for Åmli, Austevoll, Stord, Aukra, Fræna, Molde, Rauma, Sandøy, Midsund, Haugesund og Førde. Dessutan vart arbeidet med Bømlo og Flakstad starta, men her er det så langt berre laga skjema, og ikkje fått skrive inn i metafila.

Også i 2023 søkte me både til instituttet og til Meltzer om midlar til å leggja inn meir materiale, men då fekk me diverre avslag begge stader.

10.01.2024

Ragnhild Lie Anderson

Ã…rsmelding 2021

Talebanken er eit digitalt forskingsarkiv (korpus) av talemål som ligg på den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for færøysk. Det største delkorpuset, Dialektendringsprosessar, er pÃ¥ ca. 4,5 millionar ord. I tillegg ligg det inne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i °Õ²¹±ô±ð²õø°ì, som kan sjÃ¥ast pÃ¥
som eit depot frÃ¥ tidlegare granskingar før ein begynte med desse digitale korpusa. Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, er ogsÃ¥ i 2021 blitt brukt aktivt av forskarar. Materiala frÃ¥ desse korpusa kjem ogsÃ¥
andre aktørar til gode. I 2021 er det blant anna kome til bÃ¥de ein ekstern og ein intern masterstudent som nyttar seg av denne ressursen i tillegg til stipendiatar og fast tilsette.

Revisjonsprosjektet nyttar dette materialet i søka sine for Nynorskordboka og BokmÃ¥lsordboka. Norsk Ordbok signerte i Ã¥r ein avtale om Ã¥ nytta dette talemÃ¥lskorpuset som ei verdifull digital tekstsamling for Ã¥ gje dei talemÃ¥lsgrunnlag for søka sine. Me fekk i 2021 tildelt
33 034 kr for at Bente Selback skulle leggja til rette for at lydfiler som tidlegare høyrde til i SprÃ¥ksamlingane, kan leggjast inn i Talebanken og for utføring av teknisk arbeid med banken av Paul Meurer. Det er sÃ¥leis blitt jobba med metafiler i 90 nye filer (Ã…mli, Austevoll, Stord, Aukra, Fræna, Molde, Rauma, Sandøy, Midsund, Haugesund og Førde), og 221 nye postar (knytte til informantar og intervjuarar) er gjort klare.

Me vil ogsÃ¥ i 2022 søkja om midlar for Ã¥ halda fram dette arbeidet og ønskjer Ã¥ fÃ¥ lagt inn nye lydfiler i Talebanken slik at han vert eit endÃ¥ meir verdifullt talemÃ¥lskorpus. NÃ¥r dette materialet er innlagt, tek me sikte pÃ¥ Ã¥ invitera forskarar til Ã¥ bruka Talebanken og koma saman til eit forskarseminar som kan visa fram Talebanken som nasjonal forskingsresurs.

23.01.2022

Ragnhild Lie Anderson

Ã…rsmelding 2020

Talebanken er eit digitalt forskingsarkiv (korpus) av talemål som ligg på den felles plattforma under Clarino.

Det er tre norske delkorpus og eitt parallelt korpus for færøysk. Det største delkorpuset, Dialektendringsprosessar, er no kome opp i nesten 4,5 millionar ord. Det siste som kom inn her i2020, var stipendiat Per Sigmund Sævik Bøe sitt materiale pÃ¥ 163 449 ord frÃ¥ LindÃ¥s. I tillegg ligg detinne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i °Õ²¹±ô±ð²õø°ì, som kansjÃ¥ast pÃ¥ som eit depot frÃ¥ tidlegare granskingar før ein begynte med desse digitale korpusa. Tankener at materiale frÃ¥ °Õ²¹±ô±ð²õø°ì pÃ¥ sikt ogsÃ¥ kan leggjast inn i eitt av dei to andre delkorpusa og bli likebrukarvenleg.

Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, bliri dag brukt aktivt av forskarar. Materiala frå desse korpusa kjem også andre aktørar til gode. I hausthar t.d. Marta Gjernes fått lesetilgang til materiale frå Industristadprosjektet når ho skal skriva bokom Odda kommune.

Dessutan nyttar revisjonsprosjektet dette materialet i søka sine for Nynorskordboka ogBokmålsordboka. Det vil også bli inngått ein avtale om bruk av Talebanken med Norsk Ordbok våren2021. Det er då blant anna meininga at redaktørane skal få tilgang til transkripsjonar, lydopptak,årstal for opptak og dialekt/subdialekt for å kunna laga koplingar mellom ord og bakgrunn påordseddelen.

Me fekk i 2020 tildelt 19 500 kr frå instituttet i driftsmidlar, og desse kronene blei brukte tillønsutgifter til to studentar og ein forskar for å tilretteleggja og transkribera ein del opptak fråBrattvågen som vart samla inn i 2005.Det vart halde eit møte 27. november hausten 2020 mellom professor emeritus Helge Sandøy,postdoktor Randi Neteland, stipendiat Per Sigmund Sævik Bøe og førsteamanuensis Ragnhild LieAnderson og senioringeniør Paul Meurer der ein planla vidare utvikling av Talebanken. Ein konkretplan er å få i stand eit nasjonalt seminar der forskarar vert inviterte til å demonstrera bruk avTalebanken.

Postdoktor Randi Neteland har nyleg fått laga ei oppdatert brukarrettleiing til Talebanken.

06.02.2021 

Ragnhild Lie Anderson

Ã…rsmelding 2019

Talebanken ligg på den felles plattforma under Clarino.
 

Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frÃ¥ Ã¥r til Ã¥r. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 4,2 millionar ord, Industristadprosjektet (SprÃ¥kutvikling pÃ¥ industristader) som har om lag 1,8 millionar ord og °Õ²¹±ô±ð²õø°ì pÃ¥ om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki pÃ¥ sirka 470 000 ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I Ã¥r er det kome til eit nytt materiale frÃ¥ LaksevÃ¥g, eit frÃ¥ Karmøy (master) og eit materiale med to ungdomskull frÃ¥ Sogndal (forskar). Det er no to phd-kandidatar og to nye masterstudentar ved LLE som vil bruka banken i arbeidet sitt. I tillegg er det kome til nokre nye interne og eksterne forskarar. I Ã¥r begynte ogsÃ¥ staben ved Norsk Ordbok Ã¥ bruka Talebanken i søka sine. 

Me fekk i 2019 tildelt 50 000 kroner frå småforsk. Denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar. Det var også meininga at Clarino ved Paul Meurer skulle gjera arbeid for å vidareutvikla banken, men det ser ut til at dei har gløymt å senda faktura for dette arbeidet til instituttet.

Den 25. og 26. januar 2019 var det eit seminar ved LLE der me utveksla røynsler saman med Føroyskur talumálsbanki. Fleire hadde innlegg og demonstrerte korleis Talebanken verkar, og det vart diskutert korleis denne banken kan utnyttast og vidareutviklast. Hausten 2020 planlegg me eit internt seminar for å demonstrera korleis Talebanken har blitt og kan bli nytta.


02.03.2020

Ragnhild Lie Anderson

Ã…rsmelding 2018

Talebanken ligg no i den felles plattforma under Clarino. 

Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frÃ¥ Ã¥r til Ã¥r. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 3,8 millionar ord, Industristadprosjektet (SprÃ¥kutvikling pÃ¥ industristader) som har om lag 1,8 millionar ord og °Õ²¹±ô±ð²õø°ì pÃ¥ om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki. Det blir ved utgangen av Ã¥ret pÃ¥ sirka 1 mill. ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I Ã¥r er det kome til eit nytt materiale frÃ¥ LaksevÃ¥g-bydel i Bergen, og ein masterstudent har levert avhandling (Lista) basert pÃ¥ innlagt materiale i banken. Neste Ã¥r ventar me inn nytt materiale frÃ¥ Karmøy (master), Sogndal (forskar) og LindÃ¥s (phd). Det er no to phd-kandidatar og tre masterstudentar ved LLE som bruker banken i arbeidet sitt. I tillegg kjem andre forskarar.   

Me fekk i år Ida Torkildsen til å teikna ein ny og fin logo til oss.

I samband med ein søknad om eit tverrfagleg forskingsprosjekt der Talebanken ville inngÃ¥, fekk me i 2018 tildelt 50 000 kroner til HF-forsk. Noko av denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar.  

Den 25. og 26. januar 2019 vil det bli skipa til eit seminar her ved LLE  der me vil utveksla røynsler saman med Føroyskur talumálsbanki, og me skal demonstrera korleis Talebanken verkar, kan utnyttast og vidareutviklast.

21.12.2018

Ragnhild Lie Anderson

²ÑÃ¥±ô´Úø°ù±ð²õ²¹³¾±ô¾±²Ô²µ²¹

Om ²ÑÃ¥±ô´Úø°ù±ð²õ²¹³¾±ô¾±²Ô²µ²¹

²ÑÃ¥±ô´Úø°ù±ð²õ²¹³¾±ô¾±²Ô²µ²¹ er eit arkiv med talemÃ¥lsmateriale frÃ¥ ulike delar av landet, men mest frÃ¥ Vestlandet.

²ÑÃ¥±ô´Úø°ù±ð²õ²¹³¾±ô¾±²Ô²µ²¹ ved ºÚÁϳԹÏ×ÊÔ´ gÃ¥r tilbake til Folkeminnesamlingi ved Bergens Museum, som blei grunnlagd av professor Torleiv Hannaas i 1921. Ho inneheld først og fremst materiale frÃ¥ Vestlandet, det vil seie dei fire fylka Rogaland, Hordaland, Sogn og Fjordane og Møre og Romsdal. Samlinga har blitt tilført materiale jamt og trutt frÃ¥ starten av, men typen materiale har endra seg med den teknologiske utviklinga. Medan dei tidlege samlingane i stor grad var handskrivne oppskrifter av ymse slag, er det i dag i stor grad digitaliserte og transkriberte lydopptak som blir lagde inn i arkivet.

I dag omfattar oppskriftene sirka 10 000 sider med opplysningar og dialektanalysar; her er ordsamlingar pÃ¥ i alt 428 000 ord, og lydopptaka utgjer sirka 2000 timar frÃ¥ tidleg pÃ¥ 1950-talet til vÃ¥r tid.

Mykje av materialet er komme inn i samband med systematiske innsamlingsprosjekt, bÃ¥de slike ²ÑÃ¥±ô´Úø°ù±ð²õ²¹³¾±ô¾±²Ô²µ²¹ har arrangert, og slike masterstudentar og doktorgradsstipendiatar har gjennomført i samband med avhandlingsarbeida sine. Dei siste Ã¥ra har mykje materiale komme inn frÃ¥ to NFR-finansierte prosjekt, og .

FrÃ¥ 1.1.2014 er arkivet pÃ¥ vegner av LLE ansvarleg for ºÚÁϳԹÏ×ÊÔ´ sitt bidrag til det NFR-finansierte prosjektet Language Infrastructure made Accessible (LIA), der mÃ¥let er Ã¥ bygge opp ein forskingsressurs som gjer alle talemÃ¥lsressursar i Noreg tilgjengelege innanfor ein struktur.

LIA

Om LIA

LIA (Language Infrastructure made Accessible) er eit femÃ¥rig nasjonalt samarbeidsprosjekt mellom fire universitet (UiO, ºÚÁϳԹÏ×ÊÔ´, UiT og NTNU), Norsk Ordbok 2014 og Nasjonalbiblioteket. HovudmÃ¥let for prosjektet er Ã¥ redde gamle talemÃ¥lsopptak med norsk og samisk sprÃ¥k, transkribere og annotere dei og leggje dei inn i databasar slik at dei kan revitaliserast som verdifullt forskingsmateriale. Prosjektleiinga ligg ved Tekstlaboratoriet ved Universitetet i Oslo.

Sist oppdatert: 13.08.2025