Heim
 
Nettverk
 
Korpus/Database
 
Aktivitetar
 
NORMS
 
N'CLAV
 
Media
 
Bibliografi
 
Ressursar
 
Blogg
2010
2009
Desember
November
Oktober
September
August
Juni
Mai
April
Februar
Januar
2008
2007
2006
2005
Feltarbeid
 
[ Logg inn ]
Printer friendly


1

Scandiasyn-bloggen i juni 2009


 

Torsdag 25. juni

PhD Defense in Oslo
Language Engineer Anders Nøklestad defended his PhD thesis on 18 June. The title of the thesis is: ”A Machine Learning Approach to Anaphora Resolution Including Named Entity Recognition, PP Attachment Disambiguation, and Animacy Detection”.

He has done exciting research and developed a system in which a computer can recognise the antecedents of pronouns such as Norwegian han (’he’) and den (’it’). His system achieved very good results, comparable with the best ones for English, which is impressive. The long title of the thesis shows not just what the main aim of the tehsis was (that of building a good system for automatic recognition of reference), but also that he built (and tested) three modules: one that automatically recognises types of names (person, place etc.); one that determines automatically whether a PP in a given context should be analysed as modifying a noun or a verb; and one that finds automatically whether a given noun refgers to an animate or inanimate entity.

Anders got a lot of prase from the external members of the committee: Walter Daelemans (University of Antwerp), Veronique Hoste (University of Gent). The internal member of the committee, Helge Lødrup, was almost as proud as Anders’s two supervisors Christer Johansson and Janne Bondi Johannessen.

Read more here:
Article in Forskning.no
Press release by HF

Nordiasyn, Anders´disputas
Anders Nøklestad with commitee and supervisors
Janne




 

Torsdag 25. juni

Under tre intensiva dagar undersöker Kristine Bentzen och jag (Björn Lundquist) dialekterna i Salten-området. Tidigt på morgonen måndag den 15 juni flyger vi från Tromsø till Bodø för vårt första upptag, och senare på kvällen kör vi genom djupa fjordar och långa tunnlar till Nordfold, Steigen, där vi gör ytterligare ett upptag dagen efter, och sista dagen hinner vi med att göra ett upptag i Moldjord, Beiarn, ca. 4 timmars körning söder om Steigen. Hela resan är minutiöst planerad av vårt administrativa geni Torill Sommerlund, och allt flyter på utan problem.


Vis Dialektturer (UiT) 2009 i et større kart

Vårt första stopp är som sagt Bodø - mer specifikt Alstad ungdomskole. Det är sista veckan innan sommarlovet, och skolan kokar av förväntningar inför sommaren. Dialektsyntaxforskning står inte högst upp på dessa ungdomars önskelistor. Vi lyckas till slut låsa in två utvalda tiondeklassare i ett dunkelt upplyst bibliotek utan fönster. En hjälpsam lärare spär på våra mutor (godis) med ett stort fat med baguetter och läsk med hög sockerhalt, och långsamt vaknar våra informanter till liv. Vi kan påbörja våra experiment. Vi får in en hel del intressanta resultat. Det första intressanta resultatet vi ser är att subjektsdublering vid utbrytning ur vissa underordnade sättningar (typ ”han Ole Gunnar vet jag inte om han kommer”) inte är möjligt för dessa informanter. Detta är något oväntat, då denna konstruktion annars har plockats fram som ett av kännetecknena för Bodø-dialekten (se Toril Fivas artikel ”Bodødialekten” i samlingen ”Nordnorske dialektar” (Jahr & Skare (red.) 1996). (Se också Fiva 1985.) Det visar sig senare att de unga informanterna i Steigen och Beiarn avvisar denna konstruktion också. De äldre informanterna på alla tre ställen har dock inga problem med denna typ av utbrytning/dublering.

NorDiaSyn, Bodø
Kristine Bentzen med de två äldre informanterna i Bodø. (Foto: Björn Lundquist)
De unga Bodø-informanterna, liksom de unga Steigen-informanterna hade heller inte någon stark ”that-trace effect”, i motsats till resten av informanterna. De hade inga problem med sättningen ”hvem sa du at ikke hadde kommet", men de klarade inte sättningen ”hvem tror du att har gjort det” (gäller unga informanter i både Bodø och Steigen). Resten av informanterna hade förvånansvärt svårt för att behålla ”att” vid utbrtyningar – även vid utbrytning av objekt (sättningen ”hvem tror du at jeg skal treffe i morgen” bedömdes som fullständigt ogrammatisk av sex av tolv informanter).

Karakteristisk för nordnorskan är V3 i frågor med enstaviga frågeord, av typen ”ka du heter”. Samtliga av våra informanter i Salten-området accepterade som förväntat denna konstruktion. De unga informanterna i Bodø, samt vår unga manliga informant i Steigen, tillät dock även V3 med tvåstaviga ”koffer” (i frågan ”Koffer han var så sur, egentlig?”). Andra tvåstaviga frågeord som ”korsn” triggade annars V2 (liknande mönster har vi hittat tidigare, till exempel på Vannøya). Detta kan tyda på att en hel del språkförändring pågår på en ”mikronivå”. Intressant här är att de ungas språk på vissa punkter, som i fallet med ”koffer”, faktisk utvecklar drag som inte finns i ”standardnorskan”. Nya dialektala särdrag uppkommer hela tiden.

Innan de äldre informanterna anländer hinner vi med dagens andra besök till NRK’s radiostudio i Bodø, för en mer djupgående intervju med en akademisk prägel som kommer att sändas till hösten i programmet Nordnorska Akademien (ungefär, fast på norska), om jag minns rättt. Tidigare på morgonen blev vi intervjuade av en Jostein, som visst är en rikskändis i Norge, mest berömd för att han brukade kommentera Melodifestivalen/Grand Prix (med en vass tunga), och Kristine var faktisk ganska spänd inför mötet med denne storhet.

NorDiaSyn, Kristine Bentzen i Nordfold, Steigen
Kristine Bentzen i fjæra i Nordfold, Steigen. (Foto: Björn Lundquist)
De äldre informanterna svarar sedan mycket entusiastisk på alla våra frågor (äldre informanter verkar i allmänhet vara betydligt mer entusiastiska och pratglade än unga informanter, både i stad och på landsbyggd). Mest anmärkningsvärt från denna session är dessa informanters placering av trycksvaga pronominella objekt: de tillåter utan problem ”derfor leste han ikke ho”. Samma resultat får vi från de äldre informanterna i Steigen, som helt klart föredrar placering av objektspronomen efter negation (som i exemplet ovan) framför placering av objektpronomen före negation (som i ”derfor leste han ho ikke”), vilket annars är vanligare i norskan.

Vi beger oss sedan mot Steigen. Efter fyra timmar av vägarbeten och tunnlar (vi åker bl.a. igenom Norges tredje längsta tunnel, Steigentunneln, som är nästan helt spikrak – man kan se lyktorna från mötande bilar sex kilometer bort, minst) når vi Kvinnouniversitetet i Nord-Norge, ett center för ”kunnskap og likestilling” (se här http://www.kun.nl.no/ om ni är intresserade), i Nordfold, Steigen. Här får vi mat och husrum, samt tillgång till perfekta lokaler för våra dialektupptag. Dialektupptagen börjar tidigt på tisdag morgon, och kombinationen av fint väder, fin omgivning, trevlig personal och inte minst utmärkta informanter gör detta till en toppendag. Vad gäller data så förvånades jag mest över att de äldre informanterna endast högst motvillig accepterade icke-stativa passiva sättningar med icke-animata subjekt typ ”Radion blev riven/kastad ut ur bilen”. De hade dock inga problem med resultativa/stativa passiver som ”radion är riven ut” eller icke-stative passiver med animata subjekt som ”han blev kastad ut”. Detta mönster liknar faktisk det vi ser med svenskans ”bli”-passiv. Svenskan kan dock använda den så kallade s-passiven i dåtidsformer (”radion revs ut ur bilen”). Detta är ej möjligt i de flesta norska dialekter, inklusive Steigen-målet. De äldre Steigen-infomanterna föredrog istället att skriva om ”Radion blev reven ut ur bilen” till ”man reiv ut radioen av bilen”.

NorDiaSyn, Kristine Bentzen i prat med Martin Strand, Beiarn
Kristine Bentzen i samtal med Martin Strand från Beiarn. (Foto: Björn Lundquist)
På kvällen kör vi söderut mot Moldjord i Beiarn. Beiarn är ett område som ligger gömt nere i en fjord, omgiven av höga fjäll. Vägen över Beiarn-fjällen går nästan 1000 meter över havet, och när vi korsar fjället möts vi av ett snöoväder (och detta är i mitten av juni). Beiarn svämmar visst över av laxfiskefanatiker under sommaren, men vi kommer en vecka före säsongsstart, och vi är de enda gästerna på gästhuset i Moldjord. Vi träffar informanterna på skolan i Beiarn nästa morgon. Vi får också sällskap av Beiarns lokala dialektexpert Martin Strand, som för två år sedan skrev en uppsats om beiarmålet. Från honom får vi en hel del värdefull information om dialekten. Entusiastiska informanter och hjälpsam personal på skolan ser till att även detta blir en högst lyckad dag.

Jag vill avsluta detta blogginlägg med några kommentarer om användningen av reflexiver hos de olika informanterna i Salten-området. Som väntat hittade vi lång-distansreflexiver hos alla informanterna. Det finns dock en variation mellan talarna som är mycket intressant. Flera av informanterna godtar possessiva reflexiver i subjektsposition i underordnade sättningar, där det reflexiva pronomenet är bundet av subjektet i matrissatsen, som i "Regjeringen regner ikke med at forslaget sitt vil få flertall" (detta ser vi Beiarn och Bodø, dock klarast hos de äldre informanterna). Endast de äldre informanterna i Beiarn och Steigen tillät subjektsbundna reflexiva objektspronomen i objektskontroll-infinitiver, som "ho bad meg (om å) hjelpe seg". Alla informanter godtar dock "obundna", generiska reflexiver som i "Sin egen hund är alltid bäst". Variationen visar klart att lång-distansreflexiver, eller framför allt relationen mellan olika typer av långdistansreflexiver, är ett mycket komplext ämne som vi fortfarande inte har fullt grepp om.

Björn



NorDiaSyn, Beiarn
Från Beiarn – beakta nysnön på topparna! (Foto: Björn Lundquist)

 

Laurdag 6. juni

Fefor, practical session
Practical session during the Fefor course. (Photo: Björn Lundquist)
The infrastructure course continued on Friday with Elisabet Engdahl giving a morning presentation of a corpus-based comparative study of passive morphology and syntax across Mainland Scandinavian. She presented figures which show (i) that Swedish is clearly different from Norwegian and Danish in the corpora, with far more instances of the morphological s-passive than the other two languages, and (ii) that the passive generally is much more infrequent in spoken language compared to written language, something which is true for all three varieties. The program continued with a short review of the ScanDiaSyn/NORMS collaboration, systematizing the scattered information that had been mentioned given throughout the week. After lunch there was time for some leisure activities before a practical session where the participants were able to try out the various corpora developed by the Text Laboratory and others. The course ends Saturday morning with another presentation by Elisabet Engdahl plus a closing practical session.

Fefor, pingis and cat's cradle
Pingis and cat's cradle (‘fuglafit’). (Photo: Björn Lundquist)
The participants seem to be very satisfied with the course, and in particular the combination of theoretical lectures, demonstrations and practical sessions appears to have been well received. Although the majority of participants have been Nordic, there has also been a significant international presence with young researchers from Germany, Russia, Latvia, Nepal, Tunisia, Ethiopia, Uganda and more. Hopefully they will now use their newly acquired skills in processing language data to build up resources for their respective languages.

The setting for the course has lent itself well to social recreation, and in addition to the standard hanging out in the bar in the evening, people have swum (both in the (VERY cold) lake and in the pool), gone walking, thrown horse shoes, played tennis, mucked about playing cat's cradle etc. Sweet mate!

In ScanDiaSyn the work on the corpus and database will continue at full intensity. It will be very important to get feedback from actual users now in the developing phase, and at the upcoming grand meeting in Älvdalen in August this will be the topic for the group work session we normally have. Anyone who reads this is also hereby encouraged to test out the Nordic Dialect Corpus and send us feedback on how it can be improved and enhanced.

Tania and Øystein



Fefor, group
(Most of) The group at Fefor. (Photo: The lady in the reception)


 

Torsdag 4. juni

Fefor, Beáta Megyesi
Beáta Megyesi lecturing on tagging and parsing. (Photo: Øystein A. Vangsnes)
The PhD course Infrastructural tools for the study of linguistic variation is taking place this week at Fefor Høifjellshotell in the vicinity of Vinstra in Gudbrandsdalen about an hours drive/trainride north of Lillehammer. The course is intimitely tied to the research infrastructure now being built up in ScanDiaSyn, the Nordic Dialect Corpus and Database in the sense that NordForsk has sponsored this and other PhD courses related to infrastructures that they are supporting with project grants.

The participants arrived Monday evening and the course commenced Tuesday morning with a session on tagging and parsing by Beáta Megyesi and a presentation of the Dutch database for dialect syntax (DynaSAND) by Sjef Barbiers.
Fefor, mounting Feforkampen
Mounting Feforkampen, overlooking the lake and the hotel. (Photo: Øystein A. Vangsnes)
Janne B. Johannessen furthermore gave an introduction to the ScanDiaSyn resources. The program continued Wednesday with additional presentations by Megyesi and Barbiers and with practical tagging sessions. A walk to the peak Feforkampen took place after lunch, and the day was rounded off by a smoky session around the bonfire in the “lavvu” of the hotel (which was not a lavvu at all).

The setting for the course is beautiful by a lake at 900 meters above sea level, hence close to the tree limit. The participants have experienced a dramatic weather change with temperatures dropping almost 20 degrees during the first 12 hours, and yesterday evening there were quite dense snow showers. Probably quite an exotic experience for the very international group of participants.

The program continues today with a morning session on transcription and an afternoon session with presentation of micro-comparative Scandinavian research (by the undersigned).

Øystein



Fefor, snowing
Snow showers at Fefor. (Photo: Øystein A. Vangsnes)


 

Tisdag 2 juni

Monday the 25th of May, Henrik Rosenkvist, Camilla Wide, Björn Lundquist and Maia Andréasson met in Göteborg to prepare Work Package 1 of the NORDiaCORP project, Data collection in Sweden and Finland. The aim of this work package is to obtain syntactic data from Sweden and the Swedish speaking parts of Finland to complete the non-syntactic data collected by the SweDia 2000 project. The data will be comparable to at least 80% to the questionnaire data from Denmark, Faroe Islands, Iceland and Norway collected within subprojects of the ScanDiaSyn project.

Henrik Rosenkvist is the head of the group, working 50% within this project at Lund University, Camilla Wide and Maia Andréasson are coordinators at University of Helsinki and University of Gothenburg, respectively, and Björn Lundquist, University of Aarhus, will be involved as a researcher.

During the fall of 2009 and the spring of 2010 field assistants (and sometimes also researchers) will visit at least 50 of the measure points from SweDia, and – hopefully – get data from the original SweDia informants. The immediate tasks are to adapt the questionnaire to Swedish, get in contact with the informants and find suitable dialect speakers to record the Swedish sentences.

Maia






 

Weblog Commenting and Trackback by HaloScan.com


Det humanistiske fakultet, Universitetet i Tromsø, 9037 Tromsø TLF: 776 44240
Oppdatert av forskar Øystein A. Vangsnes den 26.06.2009 10:44
Ansvarlig redaktør: fakultetsdirektør Jørgen Fossland


Read this page in: Bokmål