- 1 Intro
- 2 Anwendungsgebiete
- 2.1 XSLT - die Programmiersprache im XML Bereich
- 2.2 Aktuelle und vergangene Anwendungen
- 2.3 Professionelle XML Verarbeitung
- 2.4 Technische Dokumentation
- 3 Wichtige Konzepte
- 3.1 Push vs. Pull Stylesheets
- 3.2 Eindeutigkeit der Regelbasis
- 3.3 Namespaces
- 3.4 Schemata
- 3.5 Standards
- 3.5.1 DITA
- 3.5.2 DITA Inhaltsmodell
- 3.5.1 DITA
- 4 Ausgewählte Themen
- 4.1 Transformationen mit XSLT
- 4.1.1 Vortransformationen
- 4.1.2 Komplexe XML-2-XML Transformationen
- 4.1.2.8 Vererbung
- 4.1.2.8 Vererbung
- 4.1.3 XSLT Streaming
- 4.1.3.1 XSLT Akkumulator
- 4.1.3.2 XSLT Iterator
- 4.1.4 Reguläre Ausdrücke
- 4.1.5 Modus vs. Tunnel Lösung
- 4.1.6 Identifikation mit
generate-id()
- 4.1.6.4 XPath-Achsenbereich selektieren
- 4.1.6.4.1 Funktionen und Module
- 4.1.6.4.1 Funktionen und Module
- 4.1.6.4 XPath-Achsenbereich selektieren
- 4.1.7 Webservice Calls mit doc() und unparsed-text()
- 4.1.8 Stylesheet-Parameter auf der Kommandozeile
- 4.1.9 Leerzeichenbehandlung
- 4.1.10 Mit
translate
Zeichen ersetzen
- 4.1.10.1 Spass mit dem Sequenzvergleich
- 4.1.11 Character Mappings in der Ausgabe
- 4.1.12 JSON mit XSLT 1.0 und Python lxml
- 4.1.1 Vortransformationen
- 4.2 Abfragen mit XQuery
- 4.2.5 XQuery als Programmiersprache
- 4.2.5.3
if..then..else
Ausdrücke
- 4.2.5.3.2 SQL Views in MarkLogic
- 4.2.5.3
if..then..else
Ausdrücke
- 4.2.6 Hilfreiche XQuery Schippsel
- 4.2.5 XQuery als Programmiersprache
- 4.3 XML Datenbanken
- 4.3.1 Connector zu Marklogic in Oxygen
- 4.3.2 Bi-Temporale Dokumente
- 4.3.2.1 Anlegen des Testszenarios auf der ML Konsole
- 4.3.2.2 Ausführen einiger Beispiel-Queries
- 4.3.3 Webapps mit MarkLogic
- 4.3.3.5 Wikipedia Scrapper Applikation
- 4.3.3.5 Wikipedia Scrapper Applikation
- 4.3.4 Dokument-Rechte in MarkLogic
- 4.3.5 MarkLogic Tools
- 4.3.5.1 EXPath Konsole
- 4.3.5.2 mlcp - MarkLogic Content Pump
- 4.3.5.3 Deployment-Tools
- 4.4 XSL-FO mit XSLT1.x
- 4.5 Testing
- 4.5.1 Validierung mit Schematron
- 4.5.2 Erste Schritte mit XSpec
- 4.5.1 Validierung mit Schematron
- 4.6 Performanz-Optimierung
- 4.1 Transformationen mit XSLT
- 5 Zusätzliches Know-How
- 5.1 XML Editoren
- 5.2 Quellcode-Versionskontrolle
- 5.2.1 Kurze Geschichte zur Versionskontrolle Test
- 5.2.2 GIT Kommandos
- 5.2.1 Kurze Geschichte zur Versionskontrolle Test
- 5.1 XML Editoren
- 6 Glossary
- 7 Tektur CCMS
2.4 Technische Dokumentation
95% aller technischen Dokumente werden vermtl. mit Micro$oft Word produziert.
Es gibt jedoch einige Use Cases in denen ein Standard Word Prozessor nicht mehr ausreicht.
2.4.1 Use Cases
Maschinenbauer
Ein Maschinenbauhersteller verwendet bestimmte Bauteile in mehreren Maschinen. Die Dokumentation dieser Parts soll mit wenig Aufwand in verschiedenen Büchern wiederverwendet werden. Copy 'n Paste kommt nicht in Frage, da sich wegen des schnellen technischen Fortschritts, die Dokumentation häufig ändert. Zudem läuft auf etwas älteren Maschinenmodellen noch eine alte Version von Micro$oft Windows, so dass ein Service-Techniker an der Maschine auf eine Dokumentation im veralteten Windows Hildeformat CHM angewiesen ist.
KFZ Hersteller
Ein KFZ Hersteller hat verschiedene Automodelle im Angebot. Da sich die Fahrzeuge in über
hundert Ländern verkaufen lassen, sind Handbücher in vielen Sprachen verfügbar. Es
enstehen enorme Übersetzungskosten, selbst für Teile, die in allen Büchern denselben
Inhalt tragen, wie bspw. bestimmte Warnhinweise.
Kommunikationstechnik
Ein Hersteller in der Kommunikations- und Signalerfassungstechnik will die Erstellung von
Datenblättern automatisieren, indem direkt Messergebnisse aus einer Datenbank in die
Dokumentation wandern. Dadurch werden die Kosten bzgl. einer manuellen Bedatung minimiert.
Gesucht ist ein automatisierter Prozess, der die bereitgestellten Daten zur Dokumentation
hinzufügt.
Fluggesellschaft
Eine Fluggesellschaft stellt für ihre Piloten eine eigene Dokumentation zu ihren Flugzeugtypen
bereit. Da die Piloten bei der Erstellung der Doku als sogenannte "Subject Matter Experts" mitwirken, genügt es nicht nur ein Handbuch in Papierform zu produzieren, sondern auch ein interaktives
Portal ist notwendig, mit dem die Piloten die Dokumentation Korrekturlesen und Freigeben können.
Schliesslich brauchen sie auch noch eine Version der Doku auf dem Tablet, um bspw. Checklisten vor
dem Start interaktiv abhaken zu können - diese Funktionalität rangiert gewöhnlich unter der Bezeichnung
"Electronic Flightbag - EFB" .
2.4.2 Konzepte
Um die zuvor genannten Use Cases realisieren zu können, wurden im Bereich Technische Dokumentation
Konzepte entwickelt, die sich stets - unter Einbezug der aktuellen technischen Möglichkeiten - weiterentwickeln.
Einige dieser Konzepte sind im Kapitel Anwendungsgebiete schon kurz genannt. Im Bezug auf die Use Cases oben sind die folgenden
interessant:
Modularisierung und Wiederverwendung
Durch eine feingranulare Modularisierung des Content existiert jede Informationseinheit im System nur einmal,
und kann in verschiedenen Publikationen referenziert werden. Die Auflösung dieser Referenzen geschieht
zum Zeitpunkt der Auslieferung des Ausgabeformats, d.h. bei der Bestückung des Webservers mit einer
Online-Dokumentation oder beim Erzeugen von XSL-FO als Vorformat für eine Print-Publikation mittels PDF.
Single Sourcing
Aus einer Quelle werden mehrere Ausgabeformate erzeugt. Dadurch wird Redundanz vermieden und alle Publikationen
können so stets aktuell gehalten werden. Wenn sich die Quelle ändert, wird automatisch auch das Ziel aktualisiert.
Gängige Ausgabeformate sind PDF, Online-Hilfe, Online-Portale, eBook Formate, usw.
Auch veraltete Legacy Formate, wie Windows Hilfe CHM, können bei Bedarf über eine neu hinzugefügte Ausgabestrecke
realisiert werden ohne den Kern des Systems zu belasten.
Variantensteuerung
Über konditionale Bedingungen "Gültigkeiten" auf Kapitel- und Elementebene kann die Ausgabe für verschiedene Produktvarianten feingranular gesteuert werden. Dabei werden z.B. die Varianten in einer (Entscheidungs-) baumstruktur unabhängig von der Publikation verwaltet. Erst beim Publizieren wird entschieden, welche Grafiken und Satzbausteine herangezogen werden.
Übersetzungsmanagement
Die Übersetzung einer Quellsprache in eine Zielsprache wird gemeinsam mit der Quellinformationseinheit verwaltet. So kann
auch auf Seiten der Redakteure eine Versionshistorie bzgl. der Übersetzungen gepflegt werden. Die Abhängigkeit
zum Übersetzungsdienstleister wird dadurch minimiert. Einmal getätigte Übersetzungen können wiederverwendet
werden und belasten das Budget nicht.
Automatischer Satz mit XML Technologie
XML ist gängiges Datenformat in der Industrie. XML Daten gelangen aus unterschiedlichen Quellen und über verschiedene Wege,
wie Datenbanken, Webservices, mittels BPM Prozesse, Ablageverzeichnisse, manueller Bedatung, usw. in eine
Publikationsinstanz.
Diese wird als Single Source Quelle in die Ausgabeformate transformiert. Natürlich verlangen
diese automatischen Eingabeprozesse auch eine automatische Ausgabe. Für Online-Formate ist das weniger tragisch,
aber für Print-Formate zählt ein guter Umbruch auf Paragraph-, Spalten-, Tabellenzeilen- und Seitenebene. Auch
Grafiken und Tabellen müssen gut umbrechen, bspw. soll der Untertitel immer an der Grafik gehalten werden und
Tabellenzeilen sollten, auch wie Paragraphen, keine Hurenkinder und Schusterjungen ↗ erzeugen.
Moderne End-User Applikationen
Schlussendlich liefert Word keine Datenbasis für moderne Applikationen, wie interaktive Portale oder Smartphone-
bzw. Tabletapplikationen. Gegenstand aktueller Forschung sind VR und AR, bspw. sollte es genügen eine bestimmte
Maschine im Fokus seines Smartphones zu halten, um relevante Technische Dokumentation zu übertragen. Auch werden
neue Metadatenkonzepte erforscht, wie die Modellierung der Beziehungen zwischen einzelnen Informationseinheiten
über RDF Tripel.
Bsp.: Bauteil A hat Funktion X in Maschine Q aber Bauteil A hat Funktion Y in Maschine W. Zeige mir alle Funktionen von Bauteil A.
Spezielle Content Delivery Portale spannen dazu einen Beziehungsgraphen auf und ermöglichen das schnelle Bereitstellen
der gesuchten Information. Federführend ist hier der iiRDS Standard ↗.
2.4.3 Werkzeuge
Um die genannten Use Cases umfassend zu erschlagen sind spezielle Content Management Systeme erforderlich,
sogenannte Component Content Management Systeme ↗. Diese Systeme existieren größenteils seit den 90er Jahren, laufen auf dem Desktop und erfordern enorme Betriebs- und Einführungskosten,
die sich nur größere Konzerne und Unternehmungen leisten. Tektur CCMS ↗ versucht hier mit einer
modernen, webbasierten und kostengünstigen Lösung in die Bresche zu springen.