Das InfoTip Kompendium

Ein kostenloser Service der InfoTip Service GmbH

Zum Anfang der
Seite scrollen

VoIP -Voice over IP

Inhaltsverzeichnis

1. Allgemeines

Unter IP-Telefonie, (auch Internet-Telefonie oder Voice over IP, kurz VoIP), versteht man das Telefonieren über ein Computernetzwerk.
Dabei werden die analogen Audiosignale eines Telefons in digitale Datenpakete umgewandelt und über ein Netzwerk verschickt. Die Übertragung kann entweder über das Internet oder aber über ein lokales Netzwerk erfolgen. VoIP verwendet das Internetprotokoll (IP) um die Daten in einem Netzwerk verschicken zu können. Die Telefondaten unterscheiden sich also nicht von anderen Daten im Internet.
Das Telefonieren mit der VoIP stellt sich für den Teilnehmer genauso dar wie in der klassischen Telefonie. Wie bei der herkömmlichen Telefonie teilt sich das Telefongespräch hierbei in die drei grundsätzlichen Vorgänge Verbindungsaufbau, Gesprächsübertragung und Verbindungsabbau ein. Im Unterschied zur klassischen Telefonie werden bei VoIP jedoch keine direkten Leitungen durchgeschaltet, sondern es wird Sprache digital in einem IP-Netzwerk transportiert.

2. Funktionsweise

2.1. Sprachübertragung

Prinzip

Die vom Mikrofon des Telefons kommende NF-Spannung wird in einem Analog-Digitalwandler (ADC) digitalisiert. Anschließend wird der digitale Datenstrom komprimiert. Je nach dem hierfür verwendeten Kompressionsverfahren ("Codec") variiert die erforderliche Bandbreite und die Sprachqualität.
Nach der Paketierung gehen die Sprachdaten über die Netzwerkschnittstelle direkt ins Netz und zur Gegenstelle. Nach der Dekodierung mit einem kompatiblen Codec erfolgt die DA-Wandlung, Verstärkung und Wiedergabe.

Abb. 1: Sprachübertragung mit VoIP
Abb. 1: Sprachübertragung mit VoIP
Sprachqualität und Bandbreitenbedarf

Wie bei allen Signalübertragungen gilt es auch für VoIP, dass mit steigender Übertragungsqualität auch der Bandbreitenbedarf steigt. Um bei gleicher Qualität die benötigte Bandbreite zu reduzieren, wird auf NF-Ebene das Frequenzspektrum des Sprachsignals zunächst in einem Bandpassfilter auf das Notwendige beschnitten und die Dynamik angeglichen. Anschließend wird das Sprachsignal mit einem speziell auf Sprache hin optimierten Codec kodiert. Es können sowohl verlustfreie als auch verlustbehaftete, komprimierende und nicht komprimierende Kodierverfahren eingesetzt werden. Für VoIP können eine ganze Reihe von Sprach-Codecs eingesetzt werden, wobei sich der Codec G.711 im Allgemeinen durchgesetzt hat und von allen VoIP-Endgeräten unterstützt wird. G.711 beruht auf PCM (Pulse Code Modulation), einem nichtkomprimierenden Verfahren wie es z.B. schon beim ISDN und auf der CD bzw. DVD eingesetzt wird.
Ein weiteres übliches Verfahren ist der Standard G.276, bei dem eine Variante der PCM, das ADPCM (Adaptive Differential Pulse Code Modulation), welches auch komprimiert, eingesetzt wird.
Einen vollständig anderen Weg folgt der Codec G.729. Hier wird die Sprache auf Muster, d.h. sprachtypische Eigenschaften, hin untersucht. Die so gewonnenen Parameter werden übertragen und beim Empfänger mit einem Sprachsynthesizer (Vocoder) wieder in Sprache zurückverwandelt. Zur Verbesserung der Verständlichkeit und zur Individualisierung wird ein aus dem originalen und dem synthetischen Sprachsignal gewonnenes Differenzialsignal mit übertragen und dem wiedergegebenen Signal unterlegt.
Tabelle 1 zeigt die bei den verschiedenen Codecs benötigten Bandbreiten.  Die Nettobandbreite stellt die Bandbreite des reinen Sprachsignals dar. Die Bruttobandbreite schließt den Protokoll-Overhead mit ein.

Tabelle 1: Häufig verwendete Codecs
Tabelle 1: Häufig verwendete Codecs

2.2. Endgeräte für VoIP

Es gibt drei grundsätzliche Arten von Endgeräten für die IP-Telefonie:

Abb. 2: VoIP-Endgeräte
Abb. 2: VoIP-Endgeräte
  • Mit einer auf dem PC laufenden Software, einem sogenannten Softphone
  • Mit einem direkt an das LAN anschließbaren IP-Telefon bzw. einem WLAN-Telefon für Funknetzwerke. In diesem Fall wird kein PC zum Telefonieren benötigt (außer evtl. für Konfigurationsarbeiten oder zur Erleichterung bestimmter Vorgänge wie dem Erfassen von Kurzwahlen, der Eingabe von alphanumerischen Daten o.ä.).
  • Mit einem herkömmlichen Telefon, das über ein Analog-Telefon-Adapter (einem sog. ATA) an das LAN angeschlossen wird. ATAs werden heute oft direkt in DSL-Routern integriert angeboten.

2.3. Signalisierung

Verbindungsaufbau bei direkt mit dem Internet verbundenen IP-Telefonen

Um eine Verbindung zu einem Gesprächspartner herstellen zu können, muss zunächst dem Anrufenden die IP-Adresse des Partners bekannt sein. Die meisten Privatanwender besitzen heutzutage im Internet keine feste IP-Adresse. Ihnen wird bei jedem Verbindungsaufbau zu ihrem Internetprovider eine neue IP-Adresse zugewiesen. Daher muss jeder VoIP-Teilnehmer bzw. deren Endgeräte ihre aktuelle IP-Adresse bei einem Dienstrechner (Server) mit fester IP-Adresse hinterlegen. Das Endgerät des Anrufers kann dann bei diesem Server die aktuelle IP-Adresse des gewünschten Gesprächspartners erfragen und so die Verbindung aufbauen.
Das Endgerät des Anrufers (UAC = User Agent Client) muss jedoch wissen, bei welchem Server die IP-Adresse des Gesprächspartners  (UAS = User Agent Server) hinterlegt ist. Von der Internet Engineering Task Force (IETF) wurde dafür das Session Initiation Protocol (SIP) entwickelt. Die Teilnehmer besitzen hier eine SIP-Adresse (ähnlich einer E-Mail-Adresse) im Uniform-Ressource- Identifier-Format (URI-Format). Der anzurufende Teilnehmer (UAS) soll  z.B. die SIP-Adresse "sip:12345@voip-server.de" haben. Das Endgerät des Anrufers (UAC A) meldet sich selber bei den Servern seines SIP-Providers an und schickt eine Nachricht an den Server "voip-server.de". Im Wesentlichen laufen auf diesem Server drei Dienste:

  • Der Proxy Server ist eine Vermittlungsstelle, die Anrufe entgegennimmt und an einen UAS weiterleitet. Zusätzlich ist der Proxy Server für das Rechtemanagement zuständig.
  • Der Proxy Server arbeitet mit einem Location Server zusammen, der Listen darüber führt, wo sich ein Teilnehmer gerade befindet, also mit welcher IP-Adresse er gerade im Internet kommuniziert. So kann ein Teilnehmer mit verschiedenen Endgeräten von beliebigen Orten aus kommunizieren (vorausgesetzt, es steht ein Internetzugang zur Verfügung).
  • Der Registrar nimmt Anmeldenachrichten von den Endgeräten entgegen und leitet sie an einen Location Server weiter.

Proxy Server, Registrar und Location Server laufen in der Regel auf demselben Host, der meist als SIP-Server bezeichnet wird.

Aufbau der Sprachverbindung

Der Anrufer (UAC) erhält so als Antwort vom SIP-Server die IP-Adresse des UAS 12345. Wenn beide Endgeräte die IP-Adresse der Gegenstelle kennen, ist der Verbindungsaufbau abgeschlossen, und das eigentliche Telefongespräch kann beginnen. Für das eigentliche Telefongespräch ist der SIP-Server nicht mehr notwendig, die Endgeräte senden sich ihre Daten direkt über das Internet zu, d.h. der Datenaustausch läuft am Server vorbei.
Die Übertragung der reinen Sprachdaten erfolgt mit UDP, gesteuert durch das Real-Time Transport Control Protocol (RTCP)

Abb. 3: Verbindungsaufbau bei VoIP
Abb. 3: Verbindungsaufbau bei VoIP
Verbindungsaufbau bei IP-Telefonen hinter einem DSL-Router

An IP-Telefone, die sich wie UAC B, hinter einem DSL- (NAT-) Router befinden und zur direkten Internettelefonie benutzt werden, müssen zusätzliche Konfigurationsschritte durchgeführt werden: Da DSL-Router standardgemäß keinen eingehenden Verbindungsaufbau zulassen, muss auf dem DSL-Router ein Port-Forwarding für das SIP-Protokoll auf das IP-Telefon konfiguriert werden. Zudem müssen IP-Telefone ihre öffentliche IP-Adresse kennen. Diese kann ein IP-Telefon selbstständig herausfinden, wenn der Provider einen STUN-Server (STUN = Session Traversal Utilities for NAT = Werkzeuge zum Durchqueren von NATs) betreibt. Die IP-Adresse (oder der DNS-Name) des STUN-Servers muss im IP-Telefon eingetragen werden.

2.4. Rufnummern

Es gibt derzeit eine Reihe von Ansätzen, den Teilnehmern eine individuelle Internet-Telefonnummer zu geben. Angefangen von reinen SIP-Nummern gibt es Bestrebungen zur Integration der Internet-Telefonie in den bestehenden Rufnummernplan der herkömmlichen Telefonnetze. Auch ganz neue Systeme sind in Diskussion. Wesentliche Gesichtspunkte der Europäischen Union und der deutschen Bundesnetzagentur (BNetzA) sind vor allem die Einhaltung aller Vorschriften und mittelfristig die Integration von Notrufsystemen in die Internet-Telefonie.
Für Nutzer, die über das Internet lediglich mit anderen Internet-Nutzern kostenlos telefonieren wollen, bieten sich SIP-Adressen bzw. SIP-Nummern an. Um eine eigene SIP-Adresse im URI-Format zu bekommen, kann man sich bei vielen freien oder kostenpflichtigen Anbietern anmelden. Da viele Anbieter nur SIP-Adressen mit reinen Zahlenfolgen vergeben (z.B. 12345@sip-server.de), können auch IP-Telefone mit normaler Tastatur zum Wählen verwendet werden um Gesprächspartner, die sich beim gleichen SIP-Server registriert haben, anzuwählen. Mit Vorwahlnummern können auch Gesprächspartner von anderen SIP-Servern angewählt werden. Die meisten Anbieter von SIP-Adressen ermöglichen auch das Telefonieren mit Teilnehmern des herkömmlichen Telefonnetzes, da sie bei solchen Gesprächen Geld verdienen können.
Mit der weiteren Verbreitung von VoIP wuchs auch der Bedarf an einfacheren, nichttechnischen Wahlverfahren für Rufnummern. Daher stellt die BNetzA den Providern eine begrenzte Anzahl von Rufnummer aus den größeren örtlichen Rufnummernkreisen zur Verfügung. Diese Rufnummern dürfen von den Providern jedoch nur an solche Kunden vergeben werden, die ihren ortsfesten Telefonanschluss auch in diesem Nummernbereich haben.
Nicht durchgesetzt hat sich die 032-Rufnummerngasse. Bei diesem Verfahren dient die 032 als Vorwahl, gefolgt von einer Kennung des Providers und der Endnummer des Teilnehmers. 032er Telefonnummern können nomadisch genutzt werden und können z.B. bei einem Umzug mitgenommen werden.

Notrufe und Sondernummern

Da VoIP-Gespräche nicht physisch nachverfolgt werden können, sind Anrufe der Notrufnummern oder von Sondernummer abhängig vom Provider nicht oder nur eingeschränkt möglich. In Deutschland ist nach derzeit geltendem Recht jeder Anbieter von Telekommunikationsdienstleistungen für die Öffentlichkeit dazu verpflichtet, das Routing von Notrufen zu den jeweiligen Leitstellen zu gewährleisten.
Einige Anbieter von IP-Telefonie lösen dies, indem sie bei der Anmeldung eines Teilnehmers dessen Adresse erfassen und diese der Notrufzentrale zur Verfügung stellen. Solange der Teilnehmer seinen Anschluss nur von der angemeldeten Adresse nutzt, ist somit eine Lokalisierung möglich. Die nomadische Nutzung (Benutzung an einem anderen Ort als der angemeldeten Adresse) macht natürlich diese Lokalisierung unmöglich; konsequenterweise verbieten einige Anbieter diese. [1]

2.5. Gateways - Verbindungsglieder zu anderen Netzen

Damit Verbindungen zu herkömmlichen Telefonnetzen oder Mobilfunknetzen hergestellt werden können, werden Vermittlungsrechner, sogenannte Gateways, benötigt. Diese sind sowohl mit dem Kommunikationsnetzwerk des IP-Telefons als auch mit dem fremden Telefonnetz verbunden. Empfängt ein Gateway eine Anfrage von einem IP-Telefon, leitet es diese ins Telefonnetz weiter, indem es die gewünschte Nummer anwählt. Erhält es einen Anruf aus dem Telefonnetz, leitet es die Anfrage an das entsprechende IP-Telefon weiter.

Abb. 4: Gateways stellen die Verbindung zwischen IP-Netzwerk und Telekommunikationsnetzen her.
Abb. 4: Gateways stellen die Verbindung zwischen IP-Netzwerk und Telekommunikationsnetzen her.

3. Übertragungsqualität

Ist die Sprachqualität im Wesentlichen vom verwendeten Codec und der zur Verfügung stehenden Bandbreite abhängig, so wird die Übertragungsqualität von den Eigenschaften des Netzwerks bestimmt. In einem lokalen Netzwerk kann ein Administrator durch den physischen Ausbau des Netzes und die Konfiguration der Server und Router die Übertragungsqualität optimieren. Im Internet werden die Datenpakete von einer ganzen Kette von Providern gehandhabt. Jedes Glied der Übertragungskette beeinflusst die Übertragungsqualität auf seine Weise. Eine qualitativ hochwertige Kommunikation kann nur zustande kommen, wenn die Daten schnell, kontinuierlich und vollständig übertragen werden.

Datendurchsatz

Die Menge der Daten, die pro Zeiteinheit für eine einwandfreie Kommunikation übertragen werden muss, ist abhängig vom verwendeten Codec. Wie in Tabelle 1 ersichtlich ist, muss z.B. für den G.711 ca. 110 kBit/s berücksichtigt werden. Für einen Standard 1000kBit ADSL-Anschluss, der meist eine Uploadgeschwindigkeit von 128 kBit/s hat, ist dies gerade ausreichend. Ein zweites, paralleles Telefongespräch ist nicht möglich. In diesem Fall sollte der Einsatz eines effizienteren Codecs (effizienter heißt in diesem Fall leider nicht besser verständlich) oder ein Anschluss mit höherer Uploadgeschwindigkeit in Betracht gezogen werden.

Latenz

Datenpakete in einem Netzwerk werden nicht mit unendlicher Geschwindigkeit transportiert. In jedem Switch und in jedem Router werden die Pakete vor dem Bearbeiten in Pipelines zwischengespeichert. Dieses führt zu Verzögerungen in der Signallaufzeit, die sich über lange Strecken (= viele Hops) natürlich summieren. Auch brauchen der Koder und Dekoder der Codecs eine gewisse Zeit um das Signal zu wandeln. Die Summe der Verzögerungen in der Laufzeit und in der Verarbeitung wird als Latenz bezeichnet. Latenzzeiten ("Mund zu Ohr") über 125 Millisekunden  nimmt der Mensch als störend wahr.

Jitter

Datenpakete werden in einem Netz unterschiedlich schnell transportiert. Dieses liegt an den unterschiedlichen Füllständen in den Pipelines der Router  (= Wartezeit zur Bearbeitung) und daran, dass Pakete unterschiedliche Routen nehmen. Die Pakete treffen also nicht gleichmäßig nacheinander beim Empfänger ein, sondern in ungleichmäßigen Abständen und Reihenfolge. Diese Unterschiede in den Datenübertragungsraten wird als Jitter bezeichnet. Um einen unterbrechungsfreien Datenstrom an den Dekoder liefern zu können, werden die Daten daher in einem kleinen Puffer zwischengespeichert. Die Verzögerung im Puffer addiert sich zu der Latenzzeit, daher sollte der Puffer nicht zu groß sein. Ein zu kleiner Puffer jedoch läuft leicht leer. Dann tritt eine Sprachunterbrechung auf.

Datenverlust

Werden Datenpakete auf dem Übertragungsweg aus irgendwelchen Gründen korrumpiert (beschädigt), können sie vom nächsten Router verworfen werden, d.h. sie werden nicht weiter übertragen. Auch wenn Pakete Umwege genommen haben und so spät eintreffen, dass sie im Pufferspeicher nicht an die richtige Stelle im Datenstrom eingefügt werden können, führt dies zu einem Datenverlust. Datenverlust  bedeutet aber auch endgültigen Informationsverlust, da die Sprachinformation mit dem verbindungslosen UDP übertragen werden. Bei UDP ist keine Neuanforderung von fehlenden Daten vorgesehen, weil die nachträglich gesendeten Datenpakete nicht mehr rechtzeitig im Puffer korrekt eingeordnet werden können. Die entstehenden Übertragungslücken im Signal müssen daher nach dem Dekodieren durch interpolierende Filter kaschiert werden. Eine Paketverlustrate von 5% kann gerade noch als akzeptabel bezeichnet werden. Verlustraten darüber hinaus bedeuten eine schwer gestörte Verbindung mit einer nahezu unbrauchbaren Verständigung zwischen den Gesprächsteilnehmern.

QoS - Quality of Service

Da jeder Internet Service Provider eigenverantwortlich für den Ausbau und den Zustand seines Netzes ist, kann die Übertragungsqualität im Internet nicht garantiert werden. Die Priorisierung von Echtzeitdaten (QoS = Quality of Service), wie die Sprachdaten bei VoIP, ist zwar theoretisch möglich, wird aber nicht von allen Routern durchgängig beachtet.
Innerhalb von privaten Netzen kann jedoch nach einer gewissenhaften Planung und Konfiguration der Infrastruktur eine hervorragende Übertragungsqualität erreicht werden. Die Priorisierung der Sprachdaten kann hier sowohl im Layer 2 (Sicherungsschicht im OSI-Referenzmodel) über Prioritätsklassen (CoS = Class of Service) als auch in höheren Protokollebenen über ToS (Type of Service) bzw. DiffServ erreicht werden. Auch können in einem privaten Netz Mindestbandbreiten für VoIP garantiert werden. Mechanismen und Möglichkeiten sind im Kapitel "Funktionen zur logischen Administration von Netzwerken" im Artikel "Netzwerkkomponenten - Netzverteiler" ausführlich beschrieben.

REFERENZEN

Texte

[1] Das Kapitel "Notrufe und Sondernummern" basiert teilweise auf dem Kapitel "Notrufe in VoIP-Netzen http://de.wikipedia.org/wiki/Notruf#Notrufe_in_VoIP-Netzen" aus der freien Enzyklopädie Wikipedia. Der Text ist unter der Lizenz „Creative Commons Attribution/Share Alike“ verfügbar. In der Wikipedia ist eine Liste der Autoren verfügbar.

 

Rechtshinweis

Sofern auf dieser Seite markenrechtlich geschützte Begriffe, geschützte (Wort- und/oder Bild-) Marken oder geschützte Produktnamen genannt werden, weisen wir ausdrücklich darauf hin, dass die Nennung dieser Marken, Namen und Begriffe hier ausschließlich der redaktionellen Beschreibung bzw. der Identifikation der genannten Produkte und/oder Hersteller bzw. der beschriebenen Technologien dienen.

Alle Rechte an den in diesem Kompendium erwähnten geschützten Marken- und/oder Produktnamen sind Eigentum der jeweiligen Rechteinhaber und werden hiermit ausdrücklich anerkannt. Alle in unseren Artikeln genannten und ggfs. durch Dritte geschützte Marken- und Warenzeichen unterliegen uneingeschränkt den Bestimmungen des jeweils gültigen Kennzeichenrechts sowie den Besitzrechten der jeweiligen eingetragenen Eigentümer.

Die Nennung von Produktnamen, Produkten und/oder der jeweiligen Produkthersteller dient ausschließlich Informationszwecken und stellt keine Werbung dar. InfoTip übernimmt hinsichtlich der Auswahl, Leistung oder Verwendbarkeit dieser Produkte keine Gewähr.

Sollten dennoch wider unserer Absicht Rechte Dritter verletzt werden, so bitten wir um eine Benachrichtigung ohne Kostennote.