Galileo Computing < openbook > Galileo Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
Über die Autoren
Über dieses Buch
Linux vs. BSD
1 Der Kernel
2 Die Grundlagen aus Anwendersicht
3 Die Shell
4 Reguläre Ausdrücke
5 Tools zur Dateibearbeitung
6 Die Editoren
7 Shellskriptprogrammierung
8 Benutzerverwaltung
9 Grundlegende Verwaltungsaufgaben
10 Netzwerk-Grundlagen
11 Anwendersoftware für das Netzwerk
12 Netzwerkdienste
13 Mailserver unter Linux
14 LAMP
15 DNS-Server
16 Secure Shell
17 Die grafische Oberfläche
18 Window-Manager und Desktops
19 X11-Programme
20 Multimedia und Spiele
21 Softwareentwicklung
22 Crashkurs in C und Perl
23 Sicherheit
24 Prozesse und IPC
25 Bootstrap und Shutdown
26 Dateisysteme
27 Virtualisierung und Emulatoren
A Die Installation
B Lösungen zu den einzelnen Aufgaben
C Kommandoreferenz
D X11-InputDevices
E MBR
F Die Buch-DVDs
G Glossar
H Literatur

Download:
- ZIP, ca. 6,3 MB
Buch bestellen
Ihre Meinung?

Spacer
 <<   zurück
Linux von Johannes Plötner, Steffen Wendzel
Das distributionsunabhängige Handbuch
Buch: Linux

Linux
2., aktualisierte und erweiterte Auflage
1119 S., 39,90 Euro
Galileo Computing
ISBN 978-3-8362-1090-4
gp 21 Softwareentwicklung
  gp 21.1 Interpreter und Compiler
    gp 21.1.1 C und C++
    gp 21.1.2 Perl
    gp 21.1.3 Java
    gp 21.1.4 Tcl
    gp 21.1.5 Was es sonst noch gibt
  gp 21.2 Shared Libraries
    gp 21.2.1 Vorteile der Shared Libraries
    gp 21.2.2 Statisches Linken
    gp 21.2.3 Die Dateien
  gp 21.3 Debugging
    gp 21.3.1 Vorbereitung
    gp 21.3.2 Konsolenarbeit
    gp 21.3.3 ddd
  gp 21.4 Profiling
    gp 21.4.1 Compileroption
    gp 21.4.2 gprof verwenden
    gp 21.4.3 Profiling-Daten lesen
  gp 21.5 Tracing
  gp 21.6 Hilfe beim Finden von Bugs
    gp 21.6.1 ProPolice
    gp 21.6.2 flawfinder und RATS
    gp 21.6.3 Electric Fence
  gp 21.7 Integrierte Entwicklungsumgebungen
  gp 21.8 make
    gp 21.8.1 Makefile
    gp 21.8.2 Makefile-Makros
    gp 21.8.3 Shell-Variablen in Makefiles
    gp 21.8.4 Einzelne Targets übersetzen
    gp 21.8.5 Spezielle Targets
    gp 21.8.6 Tipps im Umgang mit make
  gp 21.9 Die GNU Autotools
  gp 21.10 lex/flex und yacc/bison
    gp 21.10.1 flex grundlegend anwenden
    gp 21.10.2 bison/yacc grundlegend anwenden
  gp 21.11 Unix-Software veröffentlichen
    gp 21.11.1 Wichtige Dateien
  gp 21.12 Manpages erstellen
    gp 21.12.1 groff nutzen
    gp 21.12.2 Die Manpage installieren
  gp 21.13 Versionsmanagement
    gp 21.13.1 CVS
    gp 21.13.2 Subversion
  gp 21.14 Wichtige Bibliotheken
    gp 21.14.1 Entwicklung grafischer Oberflächen
    gp 21.14.2 Weitere Bibliotheken
  gp 21.15 Zusammenfassung
  gp 21.16 Aufgaben


Galileo Computing

21.10 lex/flex und yacc/bison  downtop

Für den anspruchsvollen angehenden Profi-Programmierer seien in diesem Kapitel auch noch einige Sätze zu den Tools flex und yacc gesagt. lex (unter Linux in der Regel flex) ist ein Tool zur lexikalischen Analyse, yacc und das ähnliche Tool bison sind zur syntaktischen Analyse gedacht.

flex, lex

Bei der lexikalischen Analyse wird eine Eingabe, also etwa eine Quellcode- oder Konfigurationsdatei, in einzelne Bestandteile, sogenannte Tokens zerlegt. Dabei werden einzelne Muster erkannt und als Token X identifiziert. Diese Muster werden bei flex und lex in Form von regulären Ausdrücken angegeben. Der Input-String sqrt(2); beispielsweise würde in einen Funktionsnamen (sqrt), eine geöffnete Klammer, einen Integer-Wert (2), eine geschlossene Klammer und ein Semikolon zerlegt werden.

yacc, Bison

Bei der Syntaxanalyse hingegen werden die einzelnen Token in ihrer Anwendungsreihenfolge (Syntax-Regel) einer Prüfung unterzogen. Die Syntax kann beispielsweise regeln, dass hinter einem Funktionsnamen beim Aufruf eine geöffnete Klammer stehen soll, dass dann die Funktionsparameter durch Kommata separiert folgen sollen usw.

Wir können leider nicht bis ins letzte Detail auf die Anwendung beider Tools eingehen – dazu wäre ein eigenes Buch notwendig --, sondern nur die wichtigsten Grundlagen für das Arbeiten mit flex und bison legen. Als hervorragende weiterführende Literatur empfiehlt sich [Herold03B]. Dieses Buch behandelt zwar nicht bison, aber dafür yacc.


Galileo Computing

21.10.1 flex grundlegend anwenden  downtop

Ein flex-Skript teilt sich in drei Teile auf, die jeweils durch eine Zeile, in der nur die Zeichen %% stehen, unterteilt werden. Im oberen Teil wird C-Code definiert, der Variablen, Funktionsprototypen und Ähnliches enthält, die später zur Verfügung stehen soll, im mittleren Teil werden die Muster für Tokens definiert, und im unteren Teil werden C-Funktionen implementiert. Die Verwendung des oberen und unteren Skriptteils ist optional.

Soll zum Beispiel mithilfe von flex ein simpler Taschenrechner realisiert werden, der Addition und Subtraktion durchführen kann, würde man ein Token für die Addition, eines für die Subtraktion und eines für die Zahlen benötigen. In flex umgesetzt, könnte dies so aussehen:

%{ 
#include <stdio.h> 
 
#define TOK_ADD 0x01 
#define TOK_SUB 0x02 
#define TOK_NUM 0x03 
 
int tmpv=0; 
int token; 
 
%} 
%% 
 
\+       { return TOK_ADD; } 
-        { return TOK_SUB; } 
[0-9]+   { tmpv=atoi(yytext); } 
[\n\t ]+       {} 
 
%% 
 
int main () 
{ 
   int value=0; 
 
   while(token=yylex()) { 
      switch(token) { 
      case TOK_ADD: 
         value+=tmpv; 
         break; 
      case TOK_SUB: 
         value-=tmpv; 
         break; 
      } 
      tmpv=0; 
      printf("\t -> %i\n", value); 
   } 
}

Listing 21.57    calc.l

Zunächst haben wir, eingebettet in %{ und %}, den C-Code für den oberen Teil des flex-Programms festgelegt. Dort binden wir für die spätere Nutzung die stdio.h ein und vergeben mit der Präprozessor-Anweisung define drei Token-Werte.

Im Muster-Teil des Programms wird festgelegt, welche Aktionen durchgeführt werden sollen, wenn ein bestimmtes Muster auftritt. Beachten Sie, dass wir das Plus-Zeichen escapt haben, damit es nicht als »mindestens ein Vorkommen eines Zeichens« im regulären Ausdruck interpretiert wird. Falls Sie das Kapitel zu regulären Ausdrücken nur überflogen oder bereits vergessen haben, sollen Sie es vor der Nutzung von flex nochmals durchlesen.

Die jeweilige Anweisung, die durchzuführen ist, wird durch Leerzeichen vom Muster getrennt und im Optimalfall in geschweifte Klammern eingebettet. Verwendet man nur eine einzelne Anweisung, kann man diese geschweiften Klammern jedoch auch weglassen.

Um keine Probleme mit der Eingabe einer neuen Zeile zu bekommen, fangen wir durch die Regel »\n { }« das Newline-Zeichen ab und führen einfach gar keine Anweisung für es aus.

Im Schlussteil holen wir uns über die Funktion yylex() das jeweilige Token und verarbeiten es in einer Schleife.

Übersetzen

Um aus diesem Code nun ein ausführbares Programm zu generieren, muss flex (bzw. lex) zunächst erst einmal den entsprechenden Quellcode für das Parsen der Text-Eingabe generieren. Dazu ruft man flex mit der jeweiligen Quelldatei auf. In unserem Fall heißt sie calc.l.

$ flex calc.l

Listing 21.58    C-Quellcode erstellen

Die nun erstellte Datei nennt sich standardmäßig lex.yy.c, ist in unserem Fall 35,5 KB groß und besteht aus 1550 Zeilen Quellcode. Es ist nicht sonderlich wichtig zu wissen, was flex dort im Detail generiert, wichtig ist, dass es den Code für einen generiert, ohne dass man es selbst tun muss, und dass es funkioniert. In diesem Fall muss dies tatsächlich nicht als schlampige Programmierung angesehen werden. Bei großen Projekten generiert flex nämlich durchaus mal einige zehntausend Zeilen an Quellcode, die sich bei jeder Übersetzung verändern – viel Spaß beim Fehlersuchen.

$ du -h lex.yy.c 
36.0K   lex.yy.c 
$ wc -l lex.yy.c 
    1550 lex.yy.c

Listing 21.59    lex.yy.c

Nun muss der Quellcode mit dem C-Compiler übersetzt werden, und anschließend können wir das fertige Programm testen. Dazu muss die Flex-Library eingelinkt werden. Unter Linux ist das -lfl, unter BSD -ll:

$ gcc -o calc lex.yy.c -lfl 
$ ./calc 
100 
+ 
         -> 100 
3 
- 
         -> 97 
96 
- 
         -> 1 
99 
+ 
         -> 100 
^D 
$

Listing 21.60    Übersetzen und linken


Galileo Computing

21.10.2 bison/yacc grundlegend anwenden  toptop

Kommen wir nach diesem kleinen Einblick in flex/lex zur syntaktischen Analyse mittels bison. Dabei wird der Quellcode des Beispiels, das wir an dieser Stelle einbringen werden, auch für yacc anwendbar sein.

Der Aufbau eines bison-Programms ist ähnlich, wie es bei flex der Fall ist. Die von flex generierten Tokens werden dabei im Mittelteil über das Keyword %token eingebunden:

%token TOK_ADD 
%token TOK_SUM 
%token TOK_NUM

Listing 21.61    %token

Im unteren Programmteil werden die syntaktischen Möglichkeiten definiert. Zunächst kümmert man sich darum, dass mehrere Kommandos hintereinander stehen können, und definiert anschließend, welche möglichen Syntax-Kombinationen es gibt. Bei uns heißen sie »add« und »sub«.

commands: /**/ | commands command; 
 
command:  add | sub;

Listing 21.62    commands

Nun wird jedes einzelne Kommando genau definiert. Dies beinhaltet die Aneinanderreihung von Tokens, die diesem Kommando entspricht, und die entsprechend auszuführenden Aktionen.

add: 
   TOK_NUM TOK_ADD TOK_NUM 
   { 
      printf("\t->%i\n", vtmp1+vtmp2); 
   }; 
 
sub: 
   TOK_NUM TOK_SUB TOK_NUM 
   { 
      printf("\t->%i\n", vtmp1-vtmp2); 
   };

Listing 21.63    add und sub

Damit wird definiert, dass wir die Token-Reihenfolgen »Zahl + Zahl« und »ZahlZahl« abdecken.

Wie Sie eventuell bemerkt haben, verwenden wir die Variablen vtmp1 und vtmp2. In diesen müssen jeweils die letzten zwei vom Benutzer eingegebenen Zahlenwerte hinterlegt sein, was sich beispielsweise folgendermaßen lösen ließe:

%% 
[0-9]+   { vtmp1=vtmp2; 
            vtmp2=atoi(yytext); 
            return TOK_NUM; 
         }

Listing 21.64    An vtmp1 und vtmp2 kommen

Des Weiteren muss nun in der Main-Funktion im flex-Code der Bison-Mainloop aufgerufen werden, was durch einen einfachen Aufruf von yyparse(); geschieht.

Übersetzen

Nun muss zunächst mit lex die angepasste calc.l und anschließend mit bison die calc.y in C-Code umgewandelt werden. Daraufhin kann mit dem gcc alles zusammengelinkt werden.

$ flex calc.l 
$ bison calc.y --output-file=calc.tab.c 
$ gcc -o lex.yy.c calc.tab.c -ll

Listing 21.65    Code erzeugen und compilieren



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.






 <<   zurück
  
  Zum Katalog
Zum Katalog: Linux






 Linux
Jetzt bestellen


 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Buchtipps
Zum Katalog: IT-Handbuch für Fachinformatiker






 IT-Handbuch für
 Fachinformatiker


Zum Katalog: Einstieg in Linux






 Einstieg in Linux


Zum Katalog: Debian GNU/Linux






 Debian GNU/Linux


Zum Katalog: Ubuntu GNU/Linux






 Ubuntu GNU/Linux


Zum Katalog: Shell-Programmierung






 Shell-Programmierung


Zum Katalog: Linux-UNIX-Programmierung






 Linux-UNIX-
 Programmierung


Zum Katalog: Praxisbuch Netzwerk-Sicherheit






 Praxisbuch
 Netzwerk-Sicherheit


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Galileo Press 2008
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Galileo Computing]

Galileo Press, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, info@galileo-press.de