Publications

Multi-level annotations

Conference of Centre de linguistique de Sorbonne :

  • Heike Baldauf-Quilliatre, Biagio Ursi, Swantje Westpfahl. Ansätze zur Segmentierung gesprochener Sprache. Das Projekt SegCor. Colloque du Centre de linguistique de Sorbonne, 01.02.2019, Paris, France. ⟨hal-02097277⟩ .

IPrA Conference 2017 :

  • Biagio Ursi, Swantje Westpfahl, Heike Baldauf-Quilliatre, Arnulf Deppermann, Carole Etienne, Jan Gorisch, Thomas Schmidt, Marie Skrovec, Véronique Traverso (2017). « Segmentation of oral corpora: First findings from a cross-language study », 15th International Pragmatics Conference – IPRA 2017, 16-21 July 2017, Belfast, United Kingdom <halshs-01773630>

Syntaxe et Discours III Conference 2017 :

  • Biagio Ursi, François Delafontaine, Carole Etienne, Flora Badin, Heike Baldauf-Quilliatre, et al.. SegCor : vers une segmentation multiniveaux pour le français parlé. Colloque Syntaxe et discours III – Types d’unités et procédures de segmentation, Jun 2017, Paris, France. 2017. 〈hal-01773625〉

FLORAL Conference 2017 :

  • Biagio Ursi, Heike Baldauf-Quilliatre, Nathalie Rossi-Gensane, Véronique Traverso, Carole Etienne, et al.. Le projet SegCor : Quelles unités pour la segmentation d’un corpus d’interactions en français et en allemand ?. Colloque FLORAL – Accessibilité, représentations et analyses des données, Mar 2017, Orléans, France. 2017. 〈hal-01773621〉

Syntaxe  et Chunks

Articles

  • Rossi-Gensane N., Ursi B., Eshkol-Taravella I. & Skrovec M. (à paraître). La syntaxe en empirie et en théorie. La proposition de segmentation multiniveau du projet SegCor pour le français parlé. In M.-J. Béguelin, G. Corminboeuf & F. Lefeuvre (Eds), Types d’unités et procédures de segmentation, Limoges : Lambert-Luca
  • Eshkol-Taravella I., Maarouf M., Badin F., Skrovec M., Tellier I., (2020). Chunk Different Kind of Spoken Discourse: Challenges for Machine Learning,  LREC2020.
  • ESHKOL-TARAVELLA Iris, MAAROUF Mariame, SKROVEC Marie, BADIN Flora (2019). Chunker différents types de discours oraux : défis pour l’apprentissage automatique TALN2019 , 1-5 juillet 2019, Toulouse, France.

Prosody

Congrès Mondial de Linguistique Française – CMLF 2018 :

Communication

  • François Delafontaine, Biagio Ursi, Luisa Acosta Córdoba. Annotation des proéminences pour la segmentation de corpus oraux : l’expérience du projet SegCor. CMLF 2018 – 6e Congrès Mondial de Linguistique Française, Jul 2018, Mons, Belgique. EDP Sciences, 2018. 〈halshs-01839314〉

Articles

  • Delafontaine, François, Ursi, Biagio, Acosta, Luisa(2018 ): Annotation des proéminences pour la segmentation de corpus oraux. L’expérience du projet SegCor. In: SHS Web Conf. 46 (2), DOI: 10.1051/shsconf/20184611001. PDF
  • Natalia Kalashnikova, Loïc Grobol, Iris Eshkol-Taravella, François Delafontaine. Automatic Period Segmentation of Oral French. LREC 2020 – 11 th edition of the Language Resources and Evaluation Conference, Mai 2020, Marseille, France.
  • Natalia Kalashnikova, Iris Eshkol Taravella, Loïc Grobol, François Delafontaine. Segmentation automatique en périodes pour le français parlé. TALN RECITAL 2020 – 27 ème Conférence sur le Traitement Automatique des Langues Naturelles, Juin 2020 Nancy, France.

Syntax, macrosyntax and interaction

Conference presentations « 50 ans d’ESLO  » 2018 :

  • Biagio Ursi, Carole Etienne, Iris Eshkol-Taravella, Nathalie Rossi-Gensane, Luisa Acosta Córdoba, et al. Segmentation in macrosyntactic units across different interaction types. A quantitative study. 50 years of corpus linguistics on oral corpora. Its contribution to the study of variation, Nov 2018, Orléans, France. 〈https://anniveslo-50ans.sciencesconf.org〉. 〈hal-01927595〉
  • Nathalie Rossi-Gensane, Biagio Ursi, Luisa Acosta Córdoba, Margot Lambert. Disfluences : réflexion autour de cas critiques pour la segmentation syntaxique et macrosyntaxique. Colloque international 50 ans de linguistique sur corpus oraux : apports à l’étude de la variation, Nov 2018, Orléans, France. 〈https://anniveslo-50ans.sciencesconf.org/〉. 〈hal-01927596〉
  • Hanna Strub, Swantje Westpfahl. Syntactic Disruptions in Various Types of Talk-in-Interaction. 50 years of corpus linguistics on oral corpora. Its contribution to the study of variation, Nov 2018, Orléans, France. 〈https://anniveslo-50ans.sciencesconf.org〉.
  • Swantje Westpfahl, Jan Gorisch, Thomas Schmidt. Spoken Language and its Syntax in Various Interaction Types. 50 years of corpus linguistics on oral corpora. Its contribution to the study of variation, Nov 2018, Orléans, France. 〈https://anniveslo-50ans.sciencesconf.org〉.

Conference presentation DFG-ANR Projects in Human Sciences Bonn 2018 :

  • Skrovec, Marie / Westpfahl, Swantje / Schmidt, Thomas (2018): Segmentation of Oral Corpora – Reflexionen über die bilaterale Zusammenarbeit, DFG-ANR-Förderprogramm in den Geistes- und Sozialwissenschaften. Kolloquium der 2015 bewilligten sozialwissenschaftlichen und geisteswissenschaftlichen Projekte, Bonn.

Proceedings of KONVENS 2018 :

  • Schmidt, Thomas; Westpfahl, Swantje (2018): A Study on Gaps and Syntactic Boundaries in Spoken Interaction. In: Proceedings of KONVENS 2018. Wien, Austria, 19.-21.09.2018. PDF

Proceedings of the LAW-MWE-CxG Workshop at COLING 2018

  • Westpfahl, Swantje; Gorisch, Jan (2018): A Syntax-Based Scheme for the Annotation and Segmentation of German Spoken Language Interactions. Joint Workshop on Linguistic Annotation, Multiword Expressions and Constructions (LAW-MWE-CxG-2018) at COLING 2018. Santa Fe, New Mexico, 25.-26.08.2018.
  • Westpfahl, Swantje; Gorisch, Jan (2018): A Syntax-Based Scheme for the Annotation and Segmentation of German Spoken Language Interactions. In: Proceedings of the Joint Workshop on Linguistic Annotation, Multiword Expressions and Constructions (LAW-MWE-CxG-2018), pp. 109-120. Workshop at COLING 2018. Santa Fe, New Mexico, 25.-26.08.2018. PDF

Workshop and seminar presentations 2019 :

  • François Delafontaine. Éléments de comparaison pour une correspondance entre unités macro-syntaxiques et interactionnelles. ELIS – Echanges de linguistique en Sorbonne, Université Paris Sorbonne, 2019, 6, pp.44-64. ⟨halshs-02391072⟩
  • Swantje Westpfahl. Ansätze zur Segmentierung gesprochener Sprache – Das Projekt SegCor am IDS Mannheim. Forschungskolloquium Korpuslinguistik an der Humbold-Universität zu Berlin. 24.10.2018, Humbold-Universität zu Berlin.

Proceedings of KONVENS 2019:

  • Ruppenhofer, Josef; Rehbein, Ines (2019): Detecting the boundaries of sentence-like units on spoken German. In: Preliminary proceedings of the 15th Conference on Natural Language Processing (KONVENS 2019), October 9 – 11, 2019 at Friedrich-Alexander-Universität Erlangen-Nürnberg. München [u.a.]: German Society for Computational Linguistics & Language Technology und Friedrich-Alexander-Universität Erlangen-Nürnberg, 2019. S. 130-139. PDF

Proceedings of LREC 2020:

  • Rehbein, Ines; Ruppenhofer, Josef; Schmidt, Thomas (2020): Improving Sentence Boundary Detection for Spoken Language Transcripts. Accepted. To appear in: Proceedings of the Language Resource and Evaluation Conference (LREC) 2020: Marseille. PDF

Guidelines (being finalised)

  • Westpfahl, Swantje; Schmidt, Thomas; Borlinghaus, Anton; Strub, Hanna (2019): Guideline. Syntaktische Segmentierung in FOLKER. Mannheim: Leibniz-Institut für Deutsche Sprache (IDS). DOI: 10.14618/ids-pub-8762. PDF