Derzeit unterstützen die Treiber, die auf dem SQL-Parser basieren, nur Lesen per SQL SELECT-Statement.
eckige Klammern --> Optional
senkrechter Strich --> Alternativ
SELECT <expression-1> [ AS <identifier-1> ]
, <expression-2> [ AS <identifier-2> ]
...
, <expression-n> [ AS <identifier-n> ]
[
FROM <identifier>.FILES() | <identifier>[.<identifier>] [tableColumns] [tableOptions]
[ WHERE <expression> ]
[ FILTER <filter-text> ]
]
Es gibt folgende Varianten bei der Tabellenangabe:
Es wird keine Datei benötigt. Die Abfrage kehrt eine Zeile zurück und das Ergbnis sind die angegebenen Ausdrücke, die auf Konstanten basieren.
Der angegebene Identifier zeigt auf ein Verzeichnis. Pro gefundener Datei liefert das Ergebnis eine Zeile.
Die Metadaten der Pseudospalten können dann verwendet werden.
Der angegebene Identifier zeigt auf eine csv-Datei. In der Regel muss der Identifier in doppelten Anführungsstrichen angegeben werden, da bereits das Punkt Zeichen für die Dateierweiterung nicht Teil eines nicht geschützen Identifiers ist.
Die csv-Datei wird geöffnet und pro Zeile in der csv-Datei wird eine Zeile zurückgekehrt.
Der erste angegebene Identifier gibt die Excel-Datei an. Der zweite angegebene Identifier liefert den Namen des Arbeitsblattes. In der Regel muss der 1. Identifier in doppelten Anführungsstrichen angegeben werden, da bereits das Punkt Zeichen für die Dateierweiterung nicht Teil eines nicht geschützen Identifiers ist.
Die Excel-Datei wird geöffnet und pro Zeile im Excel wird eine Zeile zurückgekehrt.
COLUMNS ( <identifier-1>, ... <identifier-n> ) [ HEADLINE <ganze Zahl> ]
Die optionale Angabe
HEADLINE <ganze Zahl>
können nur in den csv- und excel-Treibern verwendet werden.
in beliebiger Reihenfolge:
SEPARATED BY <Ein Zeichen in einfachen Anführungsstrichen>
QUOTED BY <Ein Zeichen in einfachen Anführungsstrichen>
ENCODING <Zeichenkette in einfachen Anführungsstrichen>
Wenn SEPARATED BY nicht angegeben wurde wird ein Komma verwendet.
Wenn QUOTED BY nicht angegeben wurde wird der doppelte Anführungsstrich verwendet.
Wenn ENCODING nicht angegeben wurde wird UTF-8 verwendet.
Identifier werden für Tabellennamen, Spaltennamen in der Quelle oder als Alias verwendet.
Identifier in doppelten Anführungsstriche werden case-sensitiv behandelt und erlauben Sonderzeichen.
Identifier ohne doppelte Anführungszeichen werden in Kleinbuchstaben gewandelt.
Beim Vergleich von Spaltennamen in csv- und excel-Dateien zu den Spaltenüberschriften wird die Groß- und Kleinschreibung ignoriert (case insensitiv).
Konstante Zahlen sind vom Datentyp BIGINT. Sie sind ganzzahlig und haben einen Wertebereich von -263 bis 263-1.
Konstanten werden ausschließlich über eine Folge von Ziffern angegeben.
Zeichenketten können beliebig lang sein und haben den Datentyp VARCHAR.
Konstante Zeichenketten werden von einfachen Anführungsstrichen umschlossen.
Um einen einfachen Anführungsstrich in einer Zeichenkette zu erhalten, müssen zwei Anführungsstiche angegeben werden.
Zeichenketten können auch mehrzeilig sein.
SELECT 'Karens'' Backstube', '!hallo
Du da!';
Ausgabe
column_1 column_2
-------- --------
Karens' Backstube !hallo
Du da!
NULL
Der Nullwert kann als Konstante über das Schlüsselwort NULL angegeben werden.
TRUE
Der Wahrheitswert Wahr wird mit dem Schlüsselwort TRUE angegeben.
FALSE
Der Wahrheitswert Falsch wird mit dem Schlüsselwort FALSE angegeben.
Die Konstante ROWNUMBER entspricht der Datenzeile in der Quelle.
Wenn die optionale HEADLINE angegeben wurde, dann entspricht die 1. Zeilennumer der 1. Zeile nach der Kopfzeile. Ansonsten ist es die 1. Zeile in der Quelle.
Die Konstante DIRECTORY ist das Verzeichnis in dem die Datei liegt.
Die Konstante FILENAME ist der Dateiname.
Expressions sind Ausdrücke, die konstante Werte, Spaltenamen aus der Quelle, Pseudospalten, Operatoren, Fallunterscheidungen oder integrierte Funktion kombinieren können.
Die Prioritäten entsprechen ANSI-SQL.
Zur Veränderung der Priorität können Ausdrücke in runden Klammern gesetzt werden. Der Ausdruck innerhalb eines runde Klammernpaars wird vor den äußeren Operation berechnet.