UserGuide: update encoding documentation

This commit is contained in:
Juergen Spitzmueller 2019-05-11 20:09:51 +02:00
parent 76e1cf6bb6
commit d93d65e688
2 changed files with 301 additions and 100 deletions

View File

@ -45334,24 +45334,117 @@ The document language and quote styles are set here.
-commands (this can fail if a \SpecialChar LaTeX
-command is not known for
a particular character).
\change_inserted -712698321 1557594829
\end_layout
\begin_layout Standard
\change_inserted -712698321 1557596095
By default, \SpecialChar LyX
outputs \SpecialChar LaTeX
files in Unicode or utf8, for that matter (which
is nowadays also \SpecialChar LaTeX
's default encoding).
This should normally fit your needs, since \SpecialChar LaTeX
's Unicode support covers the
characters of most scripts.
Nonetheless it is not yet comprehensive, so there might be cases where
using one of the traditional, or
\begin_inset Quotes eld
\end_inset
legacy
\begin_inset Quotes erd
\end_inset
, encodings is necessary.
\end_layout
\begin_layout Standard
\change_inserted -712698321 1557596136
\SpecialChar LyX
provides support for these traditional encodings.
If you chose
\family sans
Traditional (auto-selected)
\family default
from the
\family sans
Encodings
\family default
dropdown, \SpecialChar LyX
automatically selects the appropriate traditional encoding for
the given language(s).
\change_deleted -712698321 1557595310
\end_layout
\begin_layout Standard
\change_deleted -712698321 1557595310
If you use the option
\family sans
Language Default
\family default
, \SpecialChar LyX
determines the encoding of a text part from the language of this text.
If the document contains text in more than one language you may get more
than one encoding in the \SpecialChar LaTeX
\change_unchanged
If the document contains text in more than one language you
\change_inserted -712698321 1557595342
thus
\change_unchanged
may get more than one encoding in the \SpecialChar LaTeX
file.
If you do not use this option then the complete document will always use
\change_deleted -712698321 1557595350
If you do not use this option then the complete document will always use
exactly one encoding.
Checking this option is the preferred setting.
\change_unchanged
\end_layout
\begin_layout Standard
\change_inserted -712698321 1557596155
As a third option, \SpecialChar LyX
provides the
\family sans
ASCII
\family default
selection.
If this is chosen, any character outside the 7bit ASCII range will be output
as a \SpecialChar LaTeX
command.
\end_layout
\begin_layout Standard
\change_inserted -712698321 1557596040
Finally, you can also select
\family sans
Custom
\family default
, which lets you specify a specific (single) encoding for the whole document.
Note that this encoding is then used for
\emph on
any
\emph default
language.
The custom list (which is spelled out below) consists of traditional encodings,
some special cases of Unicode as well as some other special cases for specific
purposes (see explanation below).
\change_unchanged
\end_layout
\begin_layout Standard
\change_deleted -712698321 1557596063
\SpecialChar LyX
also supports Unicode output, which is particularly useful if you need
lots of special symbols or non-alphabetic scripts, respectively.
@ -45419,6 +45512,8 @@ reference "subsec:Output-file-formats"
Language Default
\family default
fails, you might try out one of these new engines.
\change_unchanged
\end_layout
\begin_layout Standard
@ -45553,21 +45648,45 @@ Here is a list with the important encodings:
\end_layout
\begin_layout Description
\change_deleted -712698321 1557595809
Language
\begin_inset space ~
\end_inset
Default
\change_inserted -712698321 1557595810
Traditional
\change_unchanged
\begin_inset space ~
\end_inset
(no
(
\change_deleted -712698321 1557595824
no
\begin_inset space ~
\end_inset
inputenc) Same as
\change_unchanged
inputenc
\change_inserted -712698321 1557595828
\family sans
not loaded
\change_unchanged
\family default
) Same as
\change_deleted -712698321 1557595854
\family sans
Language Default
\change_inserted -712698321 1557595854
Traditional (auto-selected)
\change_unchanged
\family default
, but the \SpecialChar LaTeX
-package
@ -45585,8 +45704,21 @@ status collapsed
\end_inset
is not used.
When using this, you probably need to load some additional packages manually
is not
\change_deleted -712698321 1557595861
used
\change_inserted -712698321 1557595879
loaded by \SpecialChar LyX
\change_unchanged
.
\change_inserted -712698321 1557595897
This selection might be useful if you use a class or package that pre-loads
inputenc or if inputenc must not be used for some reason.
\change_unchanged
When using this, you probably need to load some additional packages manually
in the preamble and specify the used encoding for text parts in foreign
languages in \SpecialChar TeX
code.
@ -45599,6 +45731,19 @@ ASCII the ASCII encoding, covers only plain English (7-bit ASCII).
commands, which may result in a big
file when lots of \SpecialChar LaTeX
-commands are needed.
\change_inserted -712698321 1557596221
This is the same as the
\family sans
ASCII
\family default
option in the main
\family sans
Encoding
\family default
dropdown list.
\change_unchanged
\end_layout
\begin_layout Description
@ -46070,6 +46215,21 @@ status collapsed
\end_inset
(for the languages Chinese, Japanese and Korean)
\change_inserted -712698321 1557596410
.
This encoding is selected by \SpecialChar LyX
with the default encoding (
\family sans
Unicode (utf8) [default]
\family default
in the main
\family sans
Encoding
\family default
dropdown list) with CJK languages.
Normally you do not need to set this encoding manually.
\change_unchanged
\end_layout
\begin_layout Description
@ -46133,7 +46293,24 @@ status collapsed
\end_inset
(comprehensive, including Latin, Greek, Cyrillic and CJK scripts).
(
\change_deleted -712698321 1557596443
comprehensive,
\change_unchanged
including Latin, Greek, Cyrillic and CJK scripts).
\change_inserted -712698321 1557596475
This used to be more comprehensive than
\family sans
Unicode
\begin_inset space ~
\end_inset
(utf8)
\family default
, but meanwhile it is rather outdated.
\change_unchanged
\end_layout
\begin_layout Description
@ -46158,8 +46335,24 @@ status collapsed
\end_inset
.
Currently only a limited range of characters (mainly for Latin scripts)
\change_deleted -712698321 1557596266
Currently only a limited range of characters (mainly for Latin scripts)
is supported.
\change_inserted -712698321 1557596400
This encoding is selected by \SpecialChar LyX
with the default encoding (
\family sans
Unicode (utf8) [default]
\family default
in the main
\family sans
Encoding
\family default
dropdown list) with non-CJK languages.
Normally you do not need to set this encoding manually.
\change_unchanged
\end_layout
\begin_layout Description

View File

@ -43198,98 +43198,65 @@ Hier werden die Grundsprache des Dokuments und der Stil der Anführungszeichen
\end_layout
\begin_layout Standard
Wird die Option
\family sans
Voreinstellung der Sprache
\family default
verwendet, wählt \SpecialChar LyX
die Standard-Kodierung für die Grundsprache und auch
für einzelne Textpassagen in anderen Sprachen.
Wenn Ihr Dokument also mehrsprachig ist, werden in diesem Fall gegebenenfalls
mehrere Kodierungen für das \SpecialChar LaTeX
-Dokument verwendet.
wenn Sie diese Option jedoch nicht wählen, wird die von Ihnen gewählte
Kodierung für alle Sprachen im Dokument verwendet, was zu Problemen führen
kann, wenn die gewählte Kodierung für eine der verwendeten Sprachen nicht
geeignet ist.
Die Option
\family sans
Voreinstellung der Sprache
\family default
wird deshalb empfohlen.
Standardmäßig exportiert \SpecialChar LyX
Dateien in Unicode, genauer: in utf8 (dies ist
mittlerweile auch die Standardkodierung von \SpecialChar LaTeX
).
Das sollte in den meisten Fällen die richtige Wahl sein, denn inzwischen
ist die Unicode-Unterstützung von \SpecialChar LaTeX
recht umfassend.
Vollständig ist sie allerdings noch nicht, daher kann es immer wieder Fälle
geben, in denen es nötig ist, auf eine traditionelle Kodierung zurückzugreifen.
\end_layout
\begin_layout Standard
\SpecialChar LyX
unterstützt auch Unicode-Ausgabe.
Dies kann dann sinnvoll sein, wenn Sie sehr viele Sonderzeichen benötigen
oder mit nicht-alphabetischen Schriften arbeiten.
Wenn Sie Unicode benötigen (und vorausgesetzt, Ihre \SpecialChar LaTeX
-Version unterstützt
ebenfalls Unicode, was in modernen Distributionen der Fall ist), wählen
Sie eine der unten aufgeführten UTF8-Varianten.
Leider ist die Unicode-Unterstützung im klassischen \SpecialChar LaTeX
beschränkt; es kann
also gut sein, dass Dokumente mit vielen Sonderzeichen mit der Option
unterstützt auch diese traditionellen Kodierungen.
Wenn Sie unter
\family sans
Voreinstellung der Sprache
Kodierung
\family default
problemlos ausgegeben werden (da \SpecialChar LyX
die Zeichen in entsprechende Befehle
umwandelt), dass aber eine UTF8-Kodierung Fehler produziert (da \SpecialChar LyX
dort keine
Zeichen in Befehle umwandelt, \SpecialChar LaTeX
aber nicht alle Zeichen kennt).
Mit neueren \SpecialChar TeX
-Alternativen wir Xe\SpecialChar TeX
und Lua\SpecialChar TeX
gibt es diese Probleme in aller
Regel nicht, denn sie wurden von Anfang an auf Unicode-Unterstützung angelegt.
\SpecialChar LyX
unterstützt beide dieser \SpecialChar TeX
-Alternativen über die Ausgabeformate
die Auswahl
\family sans
PDF
\begin_inset space ~
\end_inset
(XeTeX)
Traditionell (automatisch gewählt)
\family default
,
wählen, wählt \SpecialChar LyX
automatisch die passend traditionelle Kodierung für die
Sprache(n) des Dokuments aus.
Wenn Ihr Dokument mehrsprachig ist, werden in diesem Fall gegebenenfalls
mehrere Kodierungen für das \SpecialChar LaTeX
-Dokument verwendet.
\end_layout
\begin_layout Standard
Als dritte Option bietet \SpecialChar LyX
die Auswahl
\family sans
PDF
\begin_inset space ~
\end_inset
(LuaTeX)
ASCII
\family default
und
\family sans
DVI
\begin_inset space ~
\end_inset
(Lua\SpecialChar TeX
)
\family default
, siehe Abschnitt
\begin_inset space ~
\end_inset
\begin_inset CommandInset ref
LatexCommand ref
reference "subsec:Ausgabe-Dateiformate"
\end_inset
.
Sie können also auf diese zurückgreifen, wenn Sie mit vielen Sonderzeichen
oder Akzenten arbeiten und
Wenn dies gewählt wurde, wird jedes Zeichen außerhalb des 7-Bit-ASCII-Bereichs
als \SpecialChar LaTeX
-Befehl ausgegeben.
\end_layout
\begin_layout Standard
Schließlich können Sie auch
\family sans
Voreinstellung der Sprache
Benutzerdefiniert
\family default
nicht funktioniert.
wählen.
In diesem Fall können Sie eine spezifische (einzelne) Kodierung für das
gesamte Dokument auswählen.
Beachten Sie aber, dass diese Kodierung dann für
\emph on
alle
\emph default
Sprachen verwendet wird.
Die Liste mit den benutzerdefinierten Optionen (die weiter unten genauer
erläutert wird) besteht aus traditionellen Kodierungen, einigen Spezialfällen
für Unicode sowie anderen Spezialfällen für bestimmte Zwecke (vgl.
die Erläuterungen unten).
\end_layout
\begin_layout Standard
@ -43411,21 +43378,21 @@ Hier ist eine Liste mit den wichtigen Kodierungen:
\end_layout
\begin_layout Description
Sprach-Voreinstellung
Traditionell,
\begin_inset space ~
\end_inset
(ohne
lade
\begin_inset space ~
\end_inset
inputenc) Dasselbe wie
inputenc
\begin_inset space ~
\end_inset
nicht Dasselbe wie
\family sans
Voreinstellung
\family default
\family sans
der Sprache
Traditionell (automatisch gewählt)
\family default
, das \SpecialChar LaTeX
-Paket
@ -43445,6 +43412,9 @@ status collapsed
wird jedoch nicht von \SpecialChar LyX
geladen.
Diese Option kann nützlich sein, wenn Sie eine Klasse oder ein Paket verwenden,
welches inputenc selbst lädt, oder wenn inputenc aus irgend einem Grund
nicht verwendet werden kann.
Wenn Sie dies verwenden, müssen Sie wahrscheinlich zusätzliche Pakete im
\SpecialChar LaTeX
-Vorspann manuell laden und auch die Kodierung für fremdsprachige Texte
@ -43460,6 +43430,15 @@ ASCII die ASCII-Kodierung umfasst nur die im Standard-Englischen gebrauchten
-Befehle um, was zu großen \SpecialChar LaTeX
-Dateien führen
kann, wenn Sie viele Nicht-ASCII-Zeichen verwenden.
Dies ist dasselbe wie die Option
\family sans
ASCII
\family default
der Haupt-Auswahlliste
\family sans
Kodierung
\family default
.
\end_layout
\begin_layout Description
@ -43971,6 +43950,17 @@ status collapsed
\end_inset
(für die Sprachen Chinesisch, Japanisch und Koreanisch).
Diese Kodierung wird von \SpecialChar LyX
in der Standardeinstellung (
\family sans
Unicode (utf8) [Standard]
\family default
in der Haupt-Auswahlliste
\family sans
Kodierung
\family default
) verwendet, wenn CJK-Sprachen verwendet werden.
Normalerweise müssen Sie diese Kodierung nicht manuell auswählen.
\end_layout
\begin_layout Description
@ -44032,8 +44022,17 @@ status collapsed
\end_inset
(relativ umfassend, enthält lateinische, griechisch und kyrillische Alphabetzei
chen sowie Chinesische, Koreanische und Japanische Zeichen).
(enthält lateinische, griechisch und kyrillische Alphabetzeichen sowie
Chinesische, Koreanische und Japanische Zeichen).
Diese Option war einmal umfassender als
\family sans
Unicode
\begin_inset space ~
\end_inset
(utf8)
\family default
; inzwischen jedoch ist sie veraltet.
\end_layout
\begin_layout Description
@ -44058,8 +44057,17 @@ status collapsed
\end_inset
.
Unterstützt derzeit nur einen eingeschränkten Teilbereich des Unicode-Spektrums
(hauptsächlich lateinisch-alphabetische Zeichen).
Diese Kodierung wird von \SpecialChar LyX
in der Standardeinstellung (
\family sans
Unicode (utf8) [Standard]
\family default
in der Haupt-Auswahlliste
\family sans
Kodierung
\family default
) verwendet, wenn keine CJK-Sprachen verwendet werden.
Normalerweise müssen Sie diese Kodierung nicht manuell auswählen.
\end_layout
\begin_layout Description