Pour s'exprimer, les êtres humains sont capables de produire de très nombreux phonèmes (éléments phonétiques du langage) et d'en faire des mots. Cette aptitude fait appel à l'interaction complexe de plusieurs parties du corps: le cerveau, les poumons, le larynx, le pharynx, ainsi que plusieurs articulateurs mobiles (la langue, les lèvres, la mâchoire, le voile du palais). Le son est d'abord formé par les poumons et le larynx, avant d'être modifié par les voies aériennes supérieures.
Lorsque les cordes vocales sont proches, la pression exercée par l'air expiré les fait vibrer, ce qui produit un ton. Cette étape est appelée phonation. La forme et la taille des cavités du pharynx, du nez et de la bouche, déterminées par la position des articulateurs mobiles, amplifie certaines fréquences du ton. Ce processus de résonance résulte en un son complexe, correspondant un phonème unique.
Les cordes vocales sont de longues bandes de tissu musculaire qui peuvent s'allonger, se tendre ou s'écarter l'une de l'autre. Elles sont fixées au cartilage thyroïde à l'avant et aux cartilages aryténoïdes à l'arrière. La contraction de plusieurs muscles intrinsèques, également attachés aux cartilages aryténoïdes, permet aux cordes vocales de s'ouvrir largement pendant la respiration, ou au contraire de se refermer et de se tendre durant la phonation. Pour qu'un son soit produit au passage de l'air expiré, les cordes vocales doivent être plus ou moins fermées. Plus l'espace est étroit, plus le son est aigu.
Un grand nombre de muscles doivent agir simultanément afin de positionner la langue, les lèvres, le voile du palais et la mâchoire de telle sorte qu'un son (consonne ou voyelle) soit articulé. Les consonnes résultent essentiellement de la présence d'obstacles (langue, lèvres, dents, palais) sur le passage d'un courant d'air. Les consonnes occlusives (p, t, k) sont produites par le blocage complet de l'air puis par son relâchement brusque, tandis que les consonnes fricatives (f, s, ch) impliquent une obstruction incomplète du chenal expiratoire. Dans les deux catégories, certains sons nécessitent en outre la vibration des cordes vocales : ce sont les consonnes dites sonores (g, b, d, v, z, j).
L'articulation des voyelles implique l'absence d'obstacles majeurs sur le passage du son formé dans le larynx. C'est donc la résonance qui différencie ces sons. Le résonateur buccal, dont la forme et le volume varient selon la position de la langue et l'ouverture de la mâchoire, participe à l'articulation des voyelles arrondies (o, u). Quant au résonateur nasal, il participe à l'articulation des voyelles nasales (en, on, in), lorsque le voile du palais se déplace pour y laisser passer une partie de l'air.