ScanDiaSyn-databasen
Korpuset og databasen som no er under etablering innanfor ScanDiaSyn, blir den første fellesnordiske dialektsamlinga nokonsinne! Ei eiga heimeside for arbeidet med korpuset og databasen er oppretta på Tekstlaboratoriet (UiO) sine heimesider.
- Databasen vil innehalda transkribert og tagga dialektmateriale med koplingar mellom transkripsjon og lydfiler.
- Materialet omfattar både fri tale og resultat frå
spørjeskjema, systematisk innsamla frå ei jamnt fordelt mengde av
målepunkt i det nordiske språkområdet (ca. 100 i Noreg, ca. 100 i det
svenskspråklege området, ca. 20 i Danmark, ca. 10 på Færøyane,
ca. 20 på Island).
- Kvart målepunkt vil ha vanlegvis ha minst 4 informantar fordelte på
variablane [±ung] og [±kvinne], men kan i visse tilfelle ha større
representasjon (jf. SweDia 2000 med 12 informantar pr. målepunkt).
- Databasen vil bli gjort allment tilgjengeleg for søkjing via internett.
- Søkjegrensesnittet
i databasen tillet søk på ordformer såvel som grammatiske
kategoriar, og ein kan sjølvsagt kunna søkja på geografiske og andre
ikkje-lingvistiske variablar.
- Det skal etter kvart verta muleg å søkja på tvers av dei nordiske
einskildspråka, noko som føreset eit velfungerande inter-nordisk
leksikon (ScanLex).
- Databasen og grensesnittet skal på sikt innehalda ein dynamisk
kartapplikasjon som gjer det muleg for den einskilde forskar å generera
kart etter kvar einskild forskars behov og ønskjer (og dessutan syna
kovariasjonen til grammatiske fenomen).
- Så langt muleg vert eksisterande dialektkorpora og –materiale inkludert i databasen (t.d. Cordiale og SweDia 2000).
Grensesnittet i korpuset og databasen er ei vidareutvikling av eksisterande søkjegrensesnitt for
korpora ved Tekstlaboratoriet (t.d. Norsk Talemålskorpus
(NoTa)). Ein vil elles finna att funksjonar frå den
nederlandske dialektsyntaksdatabasen
DynaSAND.
Metodologi
|