RFCE013: ASCII

Ich habe mich mit Michael Steil unterhalten, den ich bereits in RFCE008 auf dem 33c3 als Gast begrüßen durfte. Dieses mal geht es um ASCII. Niemand geringerer als Vint Cerf,  steht als Autor auf dem RFC, der ASCII 1969 für die Netzwerkkommunikation standardisierte. Textcodierung ist aber viel älter, quasi antik. Über viele Entwicklungsstufen, die dem jeweiligen Übertragungsmedium angepasst waren, haben es einige Eigenheiten bis in unsere heutigen Betriebssysteme geschafft. Wir schauen uns den ASCII-RFC20 sehr genau an – beim Zuhören hilft also ein Blick ins Dokument. Wie es sich für einen RFC gehört, findet sich der Grafik-Charme einer ASCII-Tabelle auch im ASCII-RFC – also ein Standard direkt mit Anschauungsmaterial!

Wie immer, große Freude über Bewertungen bei iTunes!

Und ein kleiner Ersatz fürs Schmankerl: Spaß mit ASCII auf YouTube
Star Wars in ASCII 
Fluid 

avatar Anna-Lena Paypal Icon Flattr Icon Amazon Wishlist Icon
avatar Michael Steil
avatar podseed.org Paypal Icon Flattr Icon

Begrüßung und Gastvorstellung: Michael Steil — Vint Cerf — Monodraw — Geschichte der Textcodierung — Winkelalphabet<Winkelalphabet — Claude Chappe — Semaphore line — Samuel Morse — Morse code — SPOILERALERT! Textcodierung in 'The Marsian' — Baudot-Murray mit NUL und BEL — Emile Baudot — Baudot Code — Lochkarten und EBCDIC <EBCDIC — Und jetzt in huebsch: ASCII — ASCII in ASCII — ERRATA — Original PDF — Betriebssystem GEOS auf Commodore 64 kannte in der deutschen Version keine eckigen und geschweiften Klammern — Tabelle der Standardcodes (Themendrift: Umlaute und Nachnamen - Anna-Lena Baecker ist 'falsch')  — Wir mögen SubEthaEdit — Bobby Tables — UTF8 — LATIN — Outro: Mission ASCII.

6 thoughts on “RFCE013: ASCII

    • Den Trick mit ^i für Tabstop kannte ich schon vom N900 (ne Shell ohne Tab Completion macht halt einfach keinen Spaß), aber die genauen Hintergründe kannte ich noch nicht – zumindest nicht so im Detail. Sehr schöne Folge! :-)

  1. Sehr schöner Beitrag – bin gerade beim DEL bei ASCII hängengeblieben.
    Das ist m.E. das gleiche wie das DEL bei den Lockkarten und wie im vorherigen Kommentar erwähnt die NUL.
    Man schreibe einfach über ein Zeichen alle Bits auf 1 und dann ist das Zeichen gelöscht, DELeted. Je nach physikalischer Kodierung kann das Löschen das Setzen NUL sein (EPROM z.B. alle bits auf 0) oder eben DEL (alle bits auf 1)

    • Jap beziehungsweise, wenn man ein Backspace schickt, wird der Zeiger auf ein vergangenes Zeichen gesetzt. Wenn man nun ein DEL schickt, wird das vorhandene Zeichen z.B. 1010101 mit 1111111 überschrieben. Somit ist der vorherige Zustand nicht mehr herstellbar.
      Es ist also ein wirkliches Löschen auf einem Lochband.

  2. Was für eine schöne Episode … ein paar Anmerkungen von einem “alten Sack” zu den Teilen, die ich bis jetzt gehört habe (bin gerade zwischen EBCDIC und ASCII …)

    Eine sehr alte Form optischer Signalübertragung ist diese hier:
    https://en.wikipedia.org/wiki/Time_ball
    Das ist ja nun eigentlich weniger als 1 Bit. Das Signal besteht nur aus einer zeitlichen Komponente – wann findet der Wechsel genau statt? Die gesamte Meta-Information (was soll das bedeuten) wurde vorher verabredet …

    Baud – wichtig! Ein Baud ist ein Flusswechsel pro Sekunde im Gegensatz zu einem Bit pro Sekunde. Das wird dann relevant, wenn ich das Shannon’sche Abtasttheorem betrachte und mir Gedanken mache, wie ich mehr als Bandbreite/2 bps durch den Draht bekomme. Ich muss das Alphabet vergrößern. Also neben Amplitudenmodulation (Pieps, kein Pieps) mehrere Frequenzen und z.B. auch noch mehrere Phasen übertragen. Machen moderne Modems alles, deshalb kriegen die auch 38400 bps durch einen Telefondraht, ohne das Abtasttheorem dadurch zu widerlegen. 56k Modems funktionieren dagegen nicht Punkt-zu-Punkt sondern nur, wenn die Gegenstelle digital ist, also Software-Modems an einem Primärmultiplex-Anschluss hängen hat.

    Baudot bzw. Baudot-Murray – welche Kodierung hat in modernen Varianten wohl die NUL? 5 Löcher – klar! Und als implizite weitere Bedeutung auch noch “Shift zu Buchstaben”. D.h. man kann durch Stanzen von 5 Löchern in den Streifen Tippfehler korrigieren. Ent-Stanzen geht ja nun mal schlecht. Findet sich in Eurem verlinkten Wikipedia-Artikel, wäre aber einer Erwähnung wert gewesen ;-)

    Weshalb beendet man bei einem Fernschreiben jede Zeile grundsätzlich mit 2 CR und einem LF? Nun, wenn man sich einen Fernschreiber mal anschaut, z.B. den Siemens T100: https://de.wikipedia.org/wiki/Fernschreiber
    dann ist offensichtlich, dass das Teil ziemlich schwer ist. Den Schlitten zurück zu bewegen kann länger dauern als es braucht, um bereits das nächste Zeichen zu empfangen! Und dann haut der Kugelkopf da mitten in der Bewegung ein Zeichen auf’s Papier. Also zwei mal CR, 1 mal LF … gelernt 1987-89 bei der Bundeswehr, das ganze geht nämlich natürlich auch per Funk.

    Verschlüsselt wurde übrigens mit dem “Orestes Crypto System” alias KW7. Im Prinzip eine elektrische Enigma. Der Tagesschlüssel war die Initial- und End-Permutation, die über ein Brett mit 63 Drähten kodiert wurde.
    http://www.cryptomuseum.com/crypto/usa/kw7/index.htm

    Nächster Punkt: Fernschreiber. Die erste Generation hatte nur Großbuchstaben. Klar, reicht ja, wenn man überhaupt Buchstaben übertragen kann. Weshalb Majuskeln und keine Minuskeln? In der Gestaltung der Typen der “Schreibmaschine” war man ja frei.
    Tatsache ist, dass man das tatsächlich diskutiert hat. Kleinbuchstaben haben deutliche Vorteile was die Lesbarkeit betrifft. Immerhin kommen viele moderne Sprachen mit Lateinischem Alphabet fast ohne Großbuchstaben aus.
    Weshalb also groß? Ganz einfach: man hätte GOTT, HERR oder ER … nicht “korrekt” schreiben können. (Englische Entsprechung natürlich)

Leave a Reply

Your email address will not be published. Required fields are marked *

*