Heim
 
Nettverk
 
Korpus/Database
 
Aktivitetar
 
NORMS
 
N'CLAV
 
Media
 
Bibliografi
 
Ressursar
 
Blogg
2010
2009
2008
Desember
November
Oktober
September
August
Juni
Mai
April
Mars
Februar
Januar
2007
2006
2005
Feltarbeid
 
[ Logg inn ]
     
Printer friendly


1

ScaDiaSyn-bloggen i april 2008


 

Onsdag 30. april
Nordplus Sprog-logo
I går fekk vi beskjed om at vi får 10.000 EUR frå Nordplus Sprog til prosjektet NORPAR ("Nordisk parallellkorpus"). Eg står offisielt som prosjektleiar, men Gunnar Hrafn hadde ansvaret med å utforma søknaden som på mange måtar er basert på ein idé frå Janne: Målet med prosjektet er å få bygd opp eit nordisk parallellkorpus, og oppgåva blir i første omgang å reisa rundt til ulike forlag i Norden og be om løyve til å nytta elektroniske versjonar av dei same verka (altså på respektivt nordisk språk). Eit slikt parallellkorpus vil vera viktig i forhold til å vidareutvikla eit internordisk leksikon (ScanLex) som i sin tur er viktig for å muleggjera søking på tvers av språka i det nordiske dialektkorpuset som vi no for fullt byggjer opp.

Vi fekk omlag 40% av det vi søkte om, men ein god start er det i alle fall.

- Øystein




 

Tysdag 22. april
I dag fekk eg offisiell beskjed om noko eg har visst i omlag ei veke, nemleg at eg er blitt tildelt 300.000 NOK frå Sparebank1 Nord-Norges gavefond til innsamling og handsaming av ScanDiaSyn-materiale frå Finnmark og Nordland. Søknaden, som vart sendt inn for ein dryg månad sidan, var på meir enn det dobbelte, så tildelinga rekk nok berre til anten Finnmark eller Nordland. Men ein god nyheit er det uansett!

- Øystein




 

Måndag 21. april
På laurdag stod eit intervju med meg på trykk i Lofotposten. Intervjuet vart gjort i samband med ein artikkel om Hallfrid Christiansen, Nord-Noregs store og banebrytande dialektolog, som dei hadde fått frå Apollon, UiOs kunnskapsmagasin.

Vidare har vi fått nyss om eit intervju med Jan-Ola på Helsingfors universitets heimesider der overskrifta er "De nordiska dialekterna vittnar om livet i Norden". (Intervjuet finst jamvel i både finsk og engelsk versjon.)

- Øystein




 

Torsdag 10. april
I Oslo er vi nå i gang med å oversette lydopptakene fra ScanDiaSyn fra en lydnær transkripsjon til bokmål. Dette gjør vi fordi det skal være lettere å søke i korpuset og fordi vi vil tagge det. Søk: Den lydnære transkripsjonen er vanskelig å sette seg inn i, og fordi det på grunn av uttalevariasjon er stor variasjon i hvordan et enkelt ord blir transkribert, vil det lette søkingen at transkripsjonene oversettes til standard skriftspråk. Når man for eksempel skal søke på ”jente”, vil man få opp alle varianter av ”jente” i de norske dialektene, uten at man på forhånd må vite hvordan dette ordet uttales i de ulike dialektene eller hvordan vi har transkribert det.

Tagging: På NoTa-prosjektet la vi ned mye arbeid i å lage en talemålstagger for bokmål. Denne taggeren vil vi også bruke på de oversatte bokmålsfilene fra ScanDiaSyn. Når bokmålsordene er tagget med ordklasse og annen morfologisk informasjon, vil denne informasjonen bli lagt tilbake i filene med lydnær transkripsjon. Slik vil både ”jente” (bokmål) og alle dialektuttalene av ”jente” bli tagget med ”subst fem ent ub” osv.

Til oversettelsen bruker vi en halvautomatisk transliterator utviklet av Lars Nygaard. Denne må trenes opp. Det gjøres ved at transliteratoren først oversetter en del av den lydnære transkripsjonen. Ord den har sett før, vil bli oversatt riktig, men hvis det er nye ord i filen, vil den ikke kjenne igjen disse fra tidligere. Vi må da manuelt rette alle ordene som ikke har blitt oversatt til bokmål. Etter rettingene trenes transliteratoren på delen vi har rettet. Etter hvert som vi har oversatt mer og mer, vil transliteratoren bli bedre og bedre.

Det er selvfølgelig en del problemer som dukker opp når du skal oversette norske dialekter til bokmål. Ett av de første problemene vi støtte på, var den utrolig vide bokmålsnormalen. Skulle vi bruke hele normalen eller legge oss på en mer konservativ linje? Et annet problem vi støtte på var ord som ikke finnes i bokmålsordboka. Hvordan skal man oversette ”å æulette” til bokmål? Det er dessuten dialekter som bruker funksjonsord som ikke finnes i bokmål eller bruker funksjonsord på en helt annen måte enn i bokmål. Hvordan skal vi oversette: ”de va meir sny då no” eller ”korr hann skreik”? Hva gjør vi med bøyningsformer som finnes i bokmålsordboka, men som er brukt på ”feil” måte: ”alle var like fattig og alle var like rik” ?

Dette er noen få av problemene vi har måttet ta stilling til. Hvis du er interessert, kan du gå inn i Dokumentkista og lese veiledningen for oversetteren. Dokumentet ligger under Felles prosjektdata og mappen Transliterator. Der vil du kunne lese hvilke foreløpige konklusjoner vi har kommet frem til. Vi vil gjerne ha tilbakemeldinger! Send oss en mail: signe.laake@iln.uio.no eller kristin.hagen@iln.uio.no

- Signe




 

Tysdag 1. april
I dag fekk eg tilsendt ein artikkel som stod i Sunnmørsposten i forrige veke. Journalisten (ein gammal medstudent av meg) var innom på ScanDiaSyn-feltarbeidet som Åshild gjorde i Stryn rett før påske. Artikkelen kan lesast her.

- Øystein





Steven Pinker
Professor Steven Pinker giving his lecture at the celebration of UiT's 40th anniversary. (Photo: Maja Sojtaric)
Professor Steven Pinker was awarded an honorary doctorate from the University of Tromsø on 28 March. He was nominated by CASTL and the Department of Psychology. In the evening, at the celebration of UiT's 40th anniversary in Tromsø Kulturhus, Professor Pinker gave a lecture based on his latest book, The Stuff of Thought: Language as a Window into Human Nature.

An interview with Pinker and our own Marit Westergaard was broadcasted on NRK Språkteigen yesterday, and you can listen to the interview here.

- Øystein






 

Weblog Commenting and Trackback by HaloScan.com

[page|Side-lenke (eksempel)|9470|1]

     

Det humanistiske fakultet, Universitetet i Tromsø, 9037 Tromsø TLF: 776 44240
Oppdatert av forskar Øystein A. Vangsnes den 21.08.2008 10:39
Ansvarlig redaktør: fakultetsdirektør Jørgen Fossland


Read this page in: Bokmål