Sussi Olsen

Sussi Olsen

Videnskabelig medarbejder

  • Institut for Nordiske Studier og Sprogvidenskab

    Emil Holms Kanal 2, 2300 København S, Bygning 22, Bygning: 022-3-38

    Telefon: +45 35 32 90 64Mobil: +45 30 26 70 04

Sprogkundskaber

Dansk, engelsk, spansk

Cand.mag. i spansk (hovedfag) og datalingvistik fra Københavns Universitet.

Siden maj 1997 ansat som videnskabelig medarbejder på Center for Sprogteknologi (NorS) på Københavns Universitet.

 Opgaver og projekter

2021 -> Deltager i projektet 'Centralt OrdRegister for Dansk', COR, støttet af Digitaliseringsstyrelsen, der skal opbygge en fælles dansk sprogteknologisk ressource til brug for kunstig intelligens.

2021 -> Deltager i to mindre EU-projekter, European Language Grid and European Language Equality, der har som mål at styrke sprogteknologi for alle EU-sprog, og som bl.a. skal udgive en opdateret hvidbog om sprogteknologiens status i medlemslandene.

2020-> Deltager i EU-projektet Federated TermBank, som er en fortsættelse af eTTB og handler om at opbygge terminologi-banker i hvert land, der alle er hægtet op på en fælles termbank, Eurotermbank, således at terminologi der deles i landene, altid vil være opdateret i den centrale termbank.

2018-> Deltager i det Carlsbergstøttede DanNet2-projekt der drejer sig om at opgradere og udvide DanNet med fokus på adjektiver fundet i Den Danske Begrebsordbog. I projektet skal en større del af DanNet linkes til Princeton WordNet og desuden udarbejdes der et 'sentiment'-leksikon.

2018 -> Deltager i EU-projektet ELEXIS om samarbejde og informationsudveksling i leksikografiske miljøer i Europa og om at gøre leksikografiske data tilgængelige for sprogteknologi.

2017 -> Deltager i EU-projektet ELRC der indsamler sproglige data fra offentlige myndigheder til brug i EU's oversættelsesplatform for offentlige institutioner.

2017 - 2018 Deltager i EU-projektet eTranslation TermBank om indsamling af terminologi til EU's oversættelsesplatform.

2016 -17 Deltager i EU-projektet CLARIN+ med opgave i at finde nye CLARIN-medlemmer blandt EU-lande og associerede lande.

2016-2017 Deltager i et projekt med Det Danske Sprog- og Litteraturselskab finansieret af Carlsbergfondet om at udvikle en lemmatiser og pos-tagger for ældre dansk

2015-17 Deltager i EU-projektet Language Technology Observatory, beskæftiget med at finde og udvælge sprogresurser til brug for maskinoversættelse.

2013-17 Deltager i FKK-projektet Semantic Processing across domains, især involveret i semantisk opmærkning af korpora.

Deltager i DigHumLab-projektet med forskelligartede opgaver

2013-2016 Deltager i det nordiske netværk LUNAS som beskæftiger sig med akademisk sprogbrug

2011-2013 Deltager i EU-projektet META-NORD især involveret i opdatering af STO-ordbasen til LMF-format. 

2010 –> Underviser på ph.d.-kursus i korpuslingvistik især om LSP korpora og metadata                                               

2010-2012 Med i EU-projektet LetsMT!. Hovedsagelig beskæftiget med dataindsamling men også med fastlæggelse af emneområder, teksttyper og andre metadata.

2008 - 2011 Leder af arbejdspakke 2.2 i det danske Clarin-projekt DK-CLARIN. Formålet for denne var indsamling af fagsproglige subkorpora på i alt 11 mio. ord fordelt på tre-fem domæner samt opmærkning af teksterne med morfologisk information og termstatus. 

2007 - 2009 Deltager i FKK-projektet DAD om opmærkning af både skrevne og talte korpora med abstrakte anaforer og disses referencer.

1997-2005

2005 - Validator samt instruktør og supervisor for andre validatorer på forskellige internationale ordbogs- og korpusprojekter, bl.a.  EuroWordnet for ELRA, LC-STAR II samt to nationale hollandske korpora. Supervisor for studentermedhjælpere i et projekt om bilingual alignering af parallelle korpora. 

2007 - Beskæftiget med opdatering af STO, den sprogteknologiske ordbase, og afholdelse af kurser om denne.

2005-2007 Beskæftiget i EU-projektet Eurotermbank om opbyggelsen af en termbank for de nye EU-medlemslande.
Beskæftiget i et projekt om et program til automatisk kommatering.

2003 Beskæftiget i et projektsamarbejde med Systran hvor formålet var at levere morfologiske data til et maskinoversættelsesprojekt (da-en). 

1999-2000 Beskæftiget i EU-projektet SIMPLE hvis formål var at udvikle semantiske sprogteknologiske ordbøger.

1998 Beskæftiget i et projekt for Arbejdsskadestyrelsen hvor CST's opgave bestod i at analysere og kortlægge deres dokumentproduktion med henblik på en forenkling af denne.

1998-2006 Beskæftiget i projektet STO, den sprogteknologiske ordbase for dansk, involveret i næsten alle aspekter af ordbaseudviklingen, både lingvistiske og tekniske. Hovedopgaver udover selve ordbogsskrivningen var fastlægning af principperne for verbers og adjektivers morfologi, samt principperne for substantivernes syntaks. Derudover administrator af ordbasens tekstkorpusser

Netværk og tillidsposter

Medlem af Dansk Sprognævns repræsentantskab

Medlem af Dansk Sprognævns bestyrelse

Uddannelse

cand. mag.

ID: 1498977