Scandiasyn - Heim

ScanDiaSyn-databasen

Korpuset og databasen som no er under etablering innanfor ScanDiaSyn, blir den første fellesnordiske dialektsamlinga nokonsinne! Ei eiga heimeside for arbeidet med korpuset og databasen er oppretta på Tekstlaboratoriet (UiO) sine heimesider.

Databasen vil innehalda transkribert og tagga dialektmateriale med koplingar mellom transkripsjon og lydfiler.
Materialet omfattar både fri tale og resultat frå spørjeskjema, systematisk innsamla frå ei jamnt fordelt mengde av målepunkt i det nordiske språkområdet (ca. 100 i Noreg, ca. 100 i det svenskspråklege området, ca. 20 i Danmark, ca. 10 på Færøyane, ca. 20 på Island).
Kvart målepunkt vil ha vanlegvis ha minst 4 informantar fordelte på variablane [±ung] og [±kvinne], men kan i visse tilfelle ha større representasjon (jf. SweDia 2000 med 12 informantar pr. målepunkt).
Databasen vil bli gjort allment tilgjengeleg for søkjing via internett.
Søkjegrensesnittet i databasen tillet søk på ordformer såvel som grammatiske kategoriar, og ein kan sjølvsagt kunna søkja på geografiske og andre ikkje-lingvistiske variablar.
Det skal etter kvart verta muleg å søkja på tvers av dei nordiske einskildspråka, noko som føreset eit velfungerande inter-nordisk leksikon (ScanLex).
Databasen og grensesnittet skal på sikt innehalda ein dynamisk kartapplikasjon som gjer det muleg for den einskilde forskar å generera kart etter kvar einskild forskars behov og ønskjer (og dessutan syna kovariasjonen til grammatiske fenomen).
Så langt muleg vert eksisterande dialektkorpora og –materiale inkludert i databasen (t.d. Cordiale og SweDia 2000).

Grensesnittet i korpuset og databasen er ei vidareutvikling av eksisterande søkjegrensesnitt for korpora ved Tekstlaboratoriet (t.d. Norsk Talemålskorpus (NoTa)). Ein vil elles finna att funksjonar frå den nederlandske dialektsyntaksdatabasen DynaSAND.

Metodologi