Skip to main content

    Magnus MacHale-Gunnarsson

    Starting with a similarity measure developed by Peter Juel Henrichsen (Henrichsen 2002) for words in a cor-pus, we designed an iterative clustering algorithm, and tested it on the Göteborg Spoken Language Corpus (Allwood et al 2001) of... more
    Starting with a similarity measure developed by Peter Juel Henrichsen (Henrichsen 2002) for words in a cor-pus, we designed an iterative clustering algorithm, and tested it on the Göteborg Spoken Language Corpus (Allwood et al 2001) of 1.3 million words. The similarity measure only uses the word distribution in a 1+1 word context, which makes the clustering algorithm to a high degree independent of any theory of grammar. We be-lieve that spoken language should not be studied under the assumption that it is only a deviant version of written language, and that concepts like sentence, subject and object cannot be used without caution when studying spo-ken language. For the same reason we do not think that traditional parts-of-speech constitute a good starting point for studying spoken language grammar, and also because traditional parts-of-speech even in written lan-guage are rather unclear. Our aim with this work has been to find a neutral way of finding word clusters, which could be ...
    Ett mycket större antal människor tillbringar idag en mycket större del av sitt liv inom samhälleligt organiserat lärande än för hundra eller tom femtio år sedan. 1955 gick t ex 2% av alla ungdomar i Sverige vidare till universitet. Idag... more
    Ett mycket större antal människor tillbringar idag en mycket större del av sitt liv inom samhälleligt organiserat lärande än för hundra eller tom femtio år sedan. 1955 gick t ex 2% av alla ungdomar i Sverige vidare till universitet. Idag gör 40% det. Detta innebär att en stor del av befolkningen tillbringar 15-16 år eller ännu mer av sitt liv och i stort sett hela sin ungdom inom samhälleligt organiserat lärande. Hur detta lärande är organiserat är därför väsentligt.
    SwePub titelinformation: Några frekvensbaserad skillnader mellan svenskt och danskt talspråk.
    Ett mycket större antal människor tillbringar idag en mycket större del av sitt liv inom samhälleligt organiserat lärande än för hundra eller tom femtio år sedan. 1955 gick t ex 2% av alla ungdomar i Sverige vidare till universitet. Idag... more
    Ett mycket större antal människor tillbringar idag en mycket större del av sitt liv inom samhälleligt organiserat lärande än för hundra eller tom femtio år sedan. 1955 gick t ex 2% av alla ungdomar i Sverige vidare till universitet. Idag gör 40% det. Detta innebär att en stor del av befolkningen tillbringar 15-16 år eller ännu mer av sitt liv och i stort sett hela sin ungdom inom samhälleligt organiserat lärande. Hur detta lärande är organiserat är därför väsentligt.
    This document describes the Göteborg Transcription Standard (GTS) 1, and consists of two parts, one cross-linguistic part called GTSG (GTS General), and one language specific part called Modified Standard Orthography (MSO). MSO provides... more
    This document describes the Göteborg Transcription Standard (GTS) 1, and consists of two parts, one cross-linguistic part called GTSG (GTS General), and one language specific part called Modified Standard Orthography (MSO). MSO provides guidelines and specifics on how to modify (Swedish) standard orthography to accomodate conventionalized variation in Swedish spoken language. GTS allows the use of the two parts GTSG and MSO separately. GTSG is in facts compatible not only with MSO but also with the other orthographical ...
    Denna artikel är en kort presentation av en bok som ges ut av SweDanesprojektet. Projektet har haft stöd från NorFA: s språkteknologisatsning och har inneburit språkteknologisk metodutveckling för språkjämförande studier, baserade på två... more
    Denna artikel är en kort presentation av en bok som ges ut av SweDanesprojektet. Projektet har haft stöd från NorFA: s språkteknologisatsning och har inneburit språkteknologisk metodutveckling för språkjämförande studier, baserade på två stora talspråkskorpusar, en svensk och en dansk. En del av projektets publikationer finns i referenslistan till denna presentation.