Proceedings

Wednesday, March 15, 2017

CLARIN-D Workshop “Legal Aspects of Speech Data Collections and Corpora”

9:15
Christoph Draxler
Ludwig-Maximilians-Universität München
Aktuelle Informationen zu CLARIN-D
9:30
Michael Weller
Europäische EDV-Akademie des Rechts gGmbH
Creative Commons, Lizenzmodelle und der Umgang mit gesprochensprachlichen Daten und deren Metadaten
10:30
Coffee
10:45
Ralf Lehmann
Universität des Saarlandes
Frage- und Diskussionsrunde: Probleme und Herausforderungen der Verwertung und Weitergabe gesprochensprachlicher Daten
11:30
CLARIN-D Workshop Closing
12:00
ESSV Welcome Desk Opens

ESSV Opening

13:00
Welcome

Affectivity

Chair: Benjamin Weiss
13:20
Alicia Flores Lotz, Ingo Siegert, Michael Maruschke & Andreas Wendemuth
Otto-von-Guericke-Universität Magdeburg; Hochschule für Telekommunikation Leipzig
Audio Compression and its Impact on Emotion Recognition in Affective Computing
13:40
Magdalena Oleśkowicz-Popiel & Jolanta Bachan
Adam Mickiewicz University, Poznań
Manipulations of F0 contours in affective speech analysis
14:00
Ingo Siegert & Andreas Wendemuth
Otto-von-Guericke-Universität Magdeburg
ikannotate2 – A Tool Supporting Annotation of Emotions in Audio-Visual Data
14:20
Coffee

Physical Models of Speech Production

Chair: Ingmar Steiner
14:40
Ian S. Howard
University of Plymouth
Robotic actuation of a 2D mechanical vocal tract
15:00
Sven Grawunder, Natalie T. Uomini & Catherine Crockford
Christian-Albrechts-Universität Kiel; Max-Planck-Institut für Evolutionäre Anthropologie, Leipzig; Max-Planck-Institut für Menschheitsgeschichte, Jena
Phonetische und korpus-linguistische Methoden bei der Analyse vokaler Kommunikation von freilebenden Schimpansen im Taï National Forest
15:20
Fabian Brackhane
Institut für Deutsche Sprache, Mannheim
Vokaltraktmodelle im 18. Jahrhundert: Kempelen vs. Kratzenstein
15:40
Coffee

Keynote 1

16:00
Yves Laprie
Laboratoire lorrain de recherche en informatique et ses applications (LORIA), Nancy
An articulatory model of the complete vocal tract derived from medical images

Poster 1

17:00
Mohamed anouar Ben messaoud & Aïcha Bouzid
University of Tunis El Manar
An Improved Thresholding Function and Sparse Subspace decomposition for Speech Enhancement and its Application to Speech Recognition
Peter Birkholz & Lin Wang
Technische Universität Dresden
Herstellung und Charakterisierung künstlicher Stimmlippen aus Silikonkautschuk
Felix Burkhardt & Benjamin Weiss
Deutsche Telekom AG; Technische Universität Berlin
Complex Emotions - The Simultaneous Simulation of Emotion-Related States In Synthesized Speech
Grażyna Demenko & Jolanta Bachan
Adam Mickiewicz University, Poznań
Annotation specifications of a dialogue corpus for modelling phonetic convergence in technical systems
Hongwei Ding, Rüdiger Hoffmann & Oliver Jokisch
Shanghai Jiao Tong University; Technische Universität Dresden; Hochschule für Telekommunikation Leipzig
Prosodic Correlates of Voice Preference in Mandarin Chinese and German: A Cross-linguistic Comparison
Daniel Duran, Natalie Lewandowski, Jagoda Bruni & Antje Schweitzer
Universität Stuttgart
Akustische Korrelate wahrgenommener Persönlichkeitsmerkmale und Stimmattraktivität
Christian Hacker, Timo Sowa, Karl Weilhammer, Volker Springer, Dominique Massonie, Thomas Ranzenberger & Florian Gallwitz
Elektrobit Automotive GmbH; Technische Hochschule Nürnberg Georg Simon Ohm
Interacting with Robots - Tooling and Framework for Advanced Speech User Interfaces
Lei He & Volker Dellwo
Universität Zürich
Amplitude Envelope Kinematics of Speech Signal: Parameter Extraction and Applications
Hartmut Helmke, Youssef Oualil & Marc Schulder
Deutsches Zentrum für Luft- und Raumfahrt (DLR), Braunschweig; Universität des Saarlandes
Quantifying the Benefits of Speech Recognition for an Air Traffic Management Application
Markus Huber, Ronald Römer & Matthias Wolff
Brandenburgische Technische Universität Cottbus-Senftenberg; InnoTec21 GmbH
Little Drop of Mulligatawny Soup, Miss Sophie? Automatic Speech Understanding provided by Petri Nets
Thayabaran Kathiresan, Dieter Maurer, Heidy Suter & Volker Dellwo
Universität Zürich; Zürcher Hochschule der Künste
Enhancing the Objectivity of Interactive Formant Estimation: Introducing Euclidean Distance Measure and Numerical Conditions for Numbers and Frequency Ranges of Formants
Fabian Klause, Simon Stone & Peter Birkholz
Technische Universität Dresden
A Head-Mounted Camera System for the Measurement of Lip Protrusion and Opening during Speech Production
Sébastien Le Maguer & Ingmar Steiner
Universität des Saarlandes; DFKI GmbH
Uprooting MaryTTS: Agile Processing and Voicebuilding
Benjamin Weitz, Ingmar Steiner & Peter Birkholz
SemVox GmbH; Universität des Saarlandes; DFKI GmbH; Technische Universität Dresden
Gesture-based Articulatory Text to Speech Synthesis
Petra Wagner & Simon Betz
Universität Bielefeld
Speech Synthesis Evaluation: Realizing a Social Turn
Frank Zimmerer, Bistra Andreeva, Bernd Möbius, Zofia Malisz, Emmanuel Ferragne, François Pellegrino & Erika Brandt
Universität des Saarlandes; KTH Stockholm; Université Paris Diderot; Université Lyon 2
Perzeption von Sprechgeschwindigkeit und der (nicht nachgewiesene) Einfluss von Surprisal

Evening Program

18:00
Welcome Reception
20:00
Sitzung Förderverein

Thursday, March 16, 2017

Speech Synthesis and Regional Varieties

Chair: Petra Wagner
9:00
Michael Pucher, Carina Lozo & Sylvia Moosmüller
Österreichische Akademie der Wissenschaften, Wien; Universität Wien
Phone mapping and prosodic transfer in speech synthesis of similar dialect pairs
9:20
Ingmar Steiner, Sébastien Le Maguer, Judith Manzoni, Peter Gilles & Jürgen Trouvain
Universität des Saarlandes; DFKI GmbH; University of Luxembourg
Developing new language tools for MaryTTS: the case of Luxembourgish

Keynote 2

9:40
Stefan Kleiner
Institut für Deutsche Sprache, Mannheim
Regionale Variation in der deutschen Standardaussprache
10:30
Coffee

Language Modeling

Chair: Uwe Reichel
11:00
Sabrina Stehwien & Ngoc Thang Vu
Universität Stuttgart
First step Towards Enhancing Word Embeddings with Pitch Accent Features for DNN-based Slot Filling on Recognized Text
11:20
Markus Müller, Jörg Franke, Sebastian Stüker & Alex Waibel
Karlsruhe Institute of Technology (KIT)
Improving Phoneme Set Discovery for Documenting Unwritten Languages

Keynote 3

11:40
Dietrich Klakow
Universität des Saarlandes
Long-range language modelling
12:30
Group Photo
12:40
Lunch

Dialog Systems

Chair: Klaus Fellbaum
14:00
Ronald Böck, Olga Egorow & Andreas Wendemuth
Otto-von-Guericke-Universität Magdeburg
Speaker-Group Specific Acoustic Differences in Consecutive Stages of Spoken Interaction
14:20
Timon Zietlow, Hussein Hussein & Danny Kowerko
Technische Universität Chemnitz
Acoustic Source Localization in Home Environments - The Effect of Microphone Array Geometry (Work in Progress)

Keynote 4

14:40
Jan Alexandersson
DFKI GmbH
Metalogue – Multiperspective Multimodal Dialogue
15:30
Coffee

Poster 2

16:00
Arif Khan & Ingmar Steiner
Universität des Saarlandes; DFKI GmbH
Qualitative Evaluation and Error Analysis of Phonetic Segmentation
Peter Klimczak, Ronald Römer & Matthias Wolff
Brandenburgische Technische Universität Cottbus-Senftenberg
Ein Beitrag zur Formalisierung Finaler Systeme
Thilo Michael, Stefan Hillmann & Benjamin Weiss
Technische Universität Berlin
Alex: An Artificial Conversational Agent for Students at the TU Berlin
Elisa Pellegrino, Lei He & Volker Dellwo
Universität Zürich
Computation of L2 Speech Rhythm Based on Duration and Fundamental Frequency
Eran Raveh, Iona Gessinger, Sébastien Le Maguer, Bernd Möbius & Ingmar Steiner
Universität des Saarlandes; DFKI GmbH
Investigating Phonetic Convergence in a Shadowing Experiment with Synthetic Stimuli
Uwe D. Reichel
Hungarian Academy of Sciences, Budabest
Unsupervised extraction of prosodic structure
Ingo Schmitt, Ronald Römer, Günther Wirsching & Matthias Wolff
Brandenburgische Technische Universität Cottbus-Senftenberg; Katholische Universität Eichstätt-Ingolstadt
Semantische Repräsentation strukturierter Objekte im Hilbertraum und deren Verarbeitung nach quantenmechanischen Formalismen
Simon Stone, Konrad Schulze, Peter Steiner & Peter Birkholz
Technische Universität Dresden
Real-time manipulation of the F0-contour in synthetic speech using the Fujisaki model
Sanya Tayal, Simon Stone & Peter Birkholz
Punjab Engineering College (PEC) University of Technology; Technische Universität Dresden
Towards the measurement of the Actor's Formant in female voices
Jürgen Tchorz, Simone Wollermann & Hendrik Husstedt
Fachhochschule Lübeck; Deutsches Hörgeräte Institut Lübeck
Classification of Environmental Sounds for Future Hearing Aid Applications
Franziska Trojahn, Martin Meszaros, Michael Maruschke & Oliver Jokisch
Hochschule für Telekommunikation Leipzig
Surround Sound Processed by Opus Codec: A Perceptual Quality Assessment
Agnieszka Wagner & Jolanta Bachan
Adam Mickiewicz University, Poznań
Speaking rate variation and the interaction between hierarchical rhythmic levels
Benjamin Weiss, Anabell Hacker, Cleopatra Moshona, Frederic Rudawski & Matthias Ruhland
Technische Universität Berlin
Studying vocal social attractiveness by re-synthesis – results from two student projects applying acoustic morphing with Tandem-Straight
Ingmar Steiner
Universität des Saarlandes; DFKI GmbH
A DevOps Manifesto for Speech Corpus Management
Ines Wendler, Andreas Jatho, Ivan Kraljevski & Martin Wenzel
voice INTER connect GmbH
Nutzerzentrierter Entwurf von Multimodalen Bedienkonzepten
Jeanin Jügler & Frank Zimmerer
Universität des Saarlandes; Institut für Deutsche Sprache, Mannheim
A computer-assisted vowel trainer for the German language
Mohammed Krini
Aschaffenburg University of Applied Sciences
Refinement Methods as Preprocessing or Postprocessing for Short-Term Spectra Analysis

Evening Program

18:00
City Tour
19:00
Conference Dinner

Friday, March 17, 2017

Cognitive Models

Chair: Matthias Wolff
9:00
Peter Klimczak & Günther Wirsching
Brandenburgische Technische Universität Cottbus-Senftenberg; Katholische Universität Eichstätt-Ingolstadt
Formallogische Analysen des operanten Konditionierens
9:20
Harald Höge
Universität der Bundeswehr München
Human Feature Extraction – The Role of the Articulatory Rhythm
9:40
Coffee

Biosignals

Chair: Simon Stone
10:00
Wolfgang Wokurek
Universität Stuttgart
Ein Drucksensor für (labiale) Plosive
10:20
Kristian Kroschel & Jürgen Metzler
Karlsruhe Institute of Technology (KIT); Fraunhofer Institut für Optronik, Systemtechnik und Bildauswertung (IOSB)
Berührungslose Bestimmung der Herz- und Atmungsfrequenz

Keynote 5

10:40
Tanja Schultz
Universität Bremen
Biosignal-based spoken communication
11:30
ESSV Closing
12:00
Farewell