Python

Aus DataScience_Lernen_Wiki
Zur Navigation springen Zur Suche springen

Einleitung

Python wurde im Jahr 1991 von Guido van Rossum als Programmier-Lehrsprache entwickelt und wurde im folgenden von der internationalen Programmiergemeinde begeistert aufgenommen. Dabei ist Python eine OpenSource-Software und wird von unzähligen Programmierern weltweit unabhängig und unentgeltlich gewartet und weiterentwickelt.

Laut Redmonk ist Python, nach JavaScript, die weltweit zweithäufigst eingesetzte Programmiersprache. Besonders beliebt ist Python im akademischen Bereich als sogenannte Glue-Language (etwa: Klebersprache): durch die einfache Syntax bei gleichzeitig hoher Ausdrucksfähigkeit können die Ausgaben eines Programmes einfach für die Weiterverwendung mit anderen Programmen präpariert werden. Aber auch in den Bereichen Datenanalyse und, in jüngerer Zeit, Internet of Things (IoT) ist Python stark verbreitet.

Die Vorteile von Python sind vielfältig: die Syntax ist kurz und präzise, was die Lesbarkeit von Programmen deutlich erhöht und schnelle Ergebnisse bei vergleichsweise geringem Entwicklungsaufwand ermöglicht. Dies macht Python auch für Programmiereinsteiger interessant; im Vergleich mit beispielsweise C++ ist der Zeitaufwand zum Erlernen der Grundlagen deutlich geringer. Ein weiterer, enormer Vorteil von Python ist die Entwicklergemeinde, die leistungsstarke Funktionalitäten wie zum Beispiel Neuronale Netzwerke (TensorFlow) oder auch Bibliotheken zum Rendern von Biomolekülen (PyMol) unentgeltlich und gut dokumentiert zur Verfügung stellt.

Ein potentieller Nachteil von Python ist hingegen die Ausführgeschwindigkeit: Python wird nicht wie C++ und andere Sprachen kompiliert, das Python-Script wird erst während der Ausführung in Maschinensprache übersetzt. Für die allermeisten Anwendungen ist der Unterschied jedoch zu vernachlässigen, insbesondere durch die Verfügbarkeit effizienter numerischer Bibliotheken wie NumPy.

Installation

Windows

Für die Installation von Python unter Windows ist einfach der dem System entsprechende Installer von Python.org herunterzuladen und auszuführen.
Eine weitere Möglichkeit ist die Installation mit der Python-Distributionsplattform Anaconda, wie hier im Artikel beschrieben oder hier im Video gezeigt:

Mac-OSX

Der passende Python-Installer für Mac-OSX ist ebenfalls auf Python.org verfügbar.

Ubuntu Linux

Die Installation von Python 3.8 erfolgt durch die Eingabe dieser Befehle in der Kommandozeile:

sudo apt update
sudo apt install python3.8

Grundlagen

Code ausführen

Ein Python-Programm ist eine auf .py endende Textdatei, beispielsweise code.py. Durch die Eingabe von

python3 code.py

in dem Verzeichnis, in dem sich code.py befindet, wird das Programm gestartet.

Werte ausgeben

Variablen werden in Python mit dem Befehl print ausgegeben. Dabei können beliebige Datentypen ausgegeben werden; mehrere Variablen werden einfach per Komma getrennt.

print(1.1, "hallo", [0, 'a'])

Ausgabe:

1.1 hallo [0, 'a']

Einrückung

In Python werden Codeblöcke, im Gegensatz zu vielen anderen Programmiersprachen, durch Einrückung (Indentation) getrennt. Dies ist von hoher Bedeutung, da dies zwar zu optisch klar strukturiertem Code, aber auch zu schwierig findenden Fehlern führt. Folgender Code erzeugt keine Ausgabe, da beide print-Befehle in der bedingten Anweisung (siehe Kapitel zu bedingten Anweisungen) nie erreicht werden:

if False:
    print("eins")
    print("zwei")

Bei diesem Beispiel erfolgt als Ausgabe zwei, da der zweite print-Befehl nicht im Codeblock der nicht erfüllten Bedingten Anweisung liegt.

if False:
    print("eins")

print("zwei")

Datentypen und Variablen

Python stellt eine Vielzahl einfach zu verwendender Datentypen mit den Standardbibliotheken zur Verfügung.

Variablen in Python

In Python werden Variablen mit einem alphanumerischen Bezeichner, dem Gleichheitsoperator und dem zugewiesenen Wert erzeugt.

a = 1

Mit obigem Code wurde eine Integer-Variable namens a mit dem Wert 1 definiert. Konvention ist es, Variablenbezeichner klein zu schreiben mit Unterstrichen zur Begriffstrennung, zum Beispiel erste_variable.
Variablen in Python verfügen über keine feste Typendeklaration. Das heisst, dass sich der Variablentyp mit dem zugewiesenen Wert ändert:

a = "pagagei"

a war eine Integervariable und wurde mit obigem Befehl implizit in eine Stringvariable konvertiert.

Integers (Ganzzahlen)

Auch negative Integerwerte können einfach wie im ersten Beispiel definiert werden:

a = -111

Floats (Gleitkommazahlen)

Floats werden wie üblich mit Dezimalpunkt definiert oder auch in der e-Annotation.

a = 1.312
a = 3.1e+03

Strings (Zeichenfolgen)

Strings sind eine Aneinanderreihung von einzelnen alphanummerischen Zeichen und werden mit Anführungszeichen (" oder ') gekennzeichnet.

a = "hal\nlo"

\n ist hierbei ein Zeilenumbruch, wie es bei der Ausgabe der Variablen mit dem Befehl print zu sehen ist.

print(a)

Ausgabe:

hal
lo

Mehrzeilige Stringvariablen werden am einfachsten mit dreifachen Anführungszeichen definiert.

a = """hal
lo"""

Auf Teilsequenzen eines Strings kann mittels Indizierung zugegriffen werden, wie es im Abschnitt zu Listen gezeigt wird. Die Anzahl der Zeichen eines Strings kann mittels der Funktion len ausgegeben.

print(len(a))

Ausgabe:

6

Mit " str kann ein Zahlenwert in den entsprechenden String konvertiert werden.

a = str(3.456)

Tupel, Listen, Dictionaries

Tupel

Ein Tupel in Python ist eine Aneinanderreihung von immutablen Elementen. Ein Datentyp in Python ist immutabel, wenn er nicht durch Indizierungsoperationen verändert werden kann, also Strings und Zahlenwerte. Tupel werden mit runden Klammern definiert.

a = (1, 'spam', -1.23)
a[0] = 2  # Fehler!

Die zweite Anweisung führt zu einer Fehlermeldung, da ein Tupel nicht geändert werden kann.

Listen

Im Gegensatz zu Tupeln sind Listen mutabel und können also aus beliebigen Elementen (Zahlen, Strings, Listen, Dictionaries, ...) bestehen. Listen werden mit eckigen Klammern erzeugt.

a = [[1, 2], 'spam', -1.23, 21]

Mittels Indizierungsoperationen kann auf Listenelemente zugegriffen oder die Liste modifiziert werden. Die gewünschten Start- und Endindizes von Teillisten werden dabei in eckige Klammern gesetzt und per Doppelpunkt getrennt. Die Indizierung beginnt mit 0. Mittels Minuszeichen kann auf die Elemente vom Ende ausgehend zugegriffen werden, -1 entspricht dem letzten Element der Liste.

print(a[0])
print(a[-1])
print(a[1:-2])
a[0][0] = 'fish'
print(a)
a[1:-2] = ['swallow']
print(a)

Ausgabe:

[1, 2]
21
['spam']
[['fish', 2], 'spam', -1.23, 21]
[['fish', 2], 'swallow', -1.23, 21]

Dabei können, wie im Beispiel gezeigt, Teillisten durch verschieden große Teillisten ersetzt werden. Mit append kann einer Liste ein Element hinzuge

Listenoperationen

Python stellt vielfältige Operationen zur Verfügung, um die Arbeit mit Listen zu erleichtern. Mit append kann einer Liste ein Element hinzugefügt werden.

a = []
a.append('spam')
print(a)

Als Ausgabe erfolgt spam. Die Funktion len gibt die Länge einer Liste, hier 1 wieder:

len(['spam'])

Soll ein spezifisches Ellement aus der Liste extrahiert werden,so kann dafür die Funktion pop verwendet werden:

a = [1, 2, 3]
element = a.pop(1)
print(a, element)

Ausgabe:

[1, 3] 2

Dabei wird pop der Index des zu extrahierenden Elementes übergeben. Sollen die Elemente einer Liste sortiert werden, kann die Funktion <a href="https://docs.python.org/3/tutorial/datastructures.html">sort</a> verwendet werden. Der Parameter reverse bestimmt dabei, ob die Liste aufsteigend (False) oder absteigend (True) sortiert wird.

a = [1, 2, 3]
a.sort(reverse=True)
print(a)

Ausgabe:

[3, 2, 1]

Hierbei ist zu beachten, dass sort nicht die sortierte Liste zurückgibt, sondern die Liste nur sortiert, eine Zuweisung des Ergebnisses zu einer Variablen also scheitern würde. Mittels der Funktion sort wird das erste Auftreten eines Elementes in einer Liste ermittelt.

a = [1, 2, 3]
print(a.index(2))

Als Ausgabe erfolgt 2. remove entfernt das erste Auftreten eines Elements aus einer Liste:

a = [1, 2, 3]
a.remove(2)
print(a)

Ausgabe:

[1, 3]

Dictionaries

Dictionaries in Python sind assoziative Speicher, in denen Schlüssel-Wert-Paare gespeichert werden, beispielsweise ein Rezeptbuch mit Rezeptname als Schlüssel und dem Rezept als Wert. Dabei sind Dictionaries mutable und können also mit beliebigen Datentypen als Schlüssel oder Wert befüllt werden. Um ein Dictionary zu erzeugen, werden geschweifte Klammern verwendet. Schlüssel-Wert-Paare können bei der Erzeugung übergeben oder später hinzugefügt werden.

a = {'green': True}
a[1] = 'grenade'
a['green'] = False
a[(2, 3)] = 'wild'
print(a)

Ausgabe:

{'green': False, 1: 'grenade', (2, 3): 'wild'}

Tiefenkopie (Deepcopy)

Wird eine immutable Variable mit dem Gleichheitsoperator kopiert, so liegen im Ergebnis zwei unabhängige Variablen vor:

a = 'ni'
b = a
a = 'pi'
print(a, b)

Ergebnis:

pi ni

a und b können verschiedene Werte annehmen. Wird jedoch eine mutable Variable wie beispielsweise eine Liste so kopiert, so bleibt die Kopie vom Original abhängig:

a = ['n', 'i']
b = a
a[0] = 'p'
print(a, b)

Ergebnis:

['p', 'i'] ['p', 'i']

Obwohl a erst nach dem Kopieren in b verändert wurde, übernimmt b die Änderung! Um eine echte Kopie eines mutablen Datentypen zu erzeugen, steht die Funktion copy.deepcopy zur Verfügung.

import copy
a = ['n', 'i']
b = copy.deepcopy(a)
a[0] = 'p'
print(a, b)
['p', 'i'] ['n', 'i']

b ist nicht mehr nur eine Referenz auf a; der Ersatz des ersten Elementes von a wurde nicht auf b übertragen.


Bedingte Anweisungen

If-Bedingungen

Mit if-Bedingungen werden Anweisungen nur im vorliegen bestimmter Konditionen ausgeführt. Dabei können alle vorherig aufgeführten Vergleichsoperatoren eingesetzt werden.

a = 1
if a % 2 == 0:
  print("Gerade")
else:
  print("Ungerade")

Ausgabe:

Ungerade

Die else-Anweisung wird ausgeführt, wenn keine der vorherigen Bedingungen erfüllt wurde. Zusätzliche Konditionen werden mit elif hinzugefügt.

a = 2
if a == 0:
  print("Null")
elif a % 2 == 0:
  print("Gerade")
else:
  print("Ungerade")

Ausgabe:

Gerade

Ternäre Operatoren

Ternäre Operatoren sind auf eine Zeile kondensierte If-Bedingungen.

a = 2
ausgabe = "Gerade" if a % 2 == 0 else "Ungerade"
print(ausgabe)

Ausgabe:

Gerade

Try-Blöcke

try-Blöcke dienen der Kontrolle des Programmflusses, beispielsweise um Fehler und Ausnahmesituationen zu behandeln. Der try-Block enthält auszuführenden Code, der darauf folgende except-Block wird ausgeführt, falls beim try-Block ein Fehler (Exception) aufgetreten ist.

try:
  print(1/0)
except:
  print("Fehler: nicht durch Null teilen")

Ausgabe:

Fehler: nicht durch Null teilen

Zusätzlich kann ein try-Block um einen finally-Block ergänzt werden, der sowohl ausgeführt wird, wenn ein Fehler auftritt, als auch, wenn nicht.

try:
  print(1/0)
except:
  print("Fehler: nicht durch Null teilen")
finally:
  print("Angekommen")


Schleifen

For-Schleife

Mittels for-Schleifen werden Programmanweisungen wiederholt ausgeführt. Dabei wird über eine Liste iteriert, häufig über eine mit range erzeugte Liste aufeinanderfolgender Zahlen. Jedoch kann über beliebige Python-Objekte iteriert werden.

word = 'spam'
indices = range(len(word))
print(list(indices))

for i in indices:
  print(word[i])

for c in word:
  print(c)

Ausgabe:

[0, 1, 2, 3]
s
p
a
m
s
p
a
m

range ist ein Generator und muss zur Darstellung in eine Liste konvertiert werden. Die erste for-Schleife iteriert über die erzeugte Indexliste, die zweite Schleife direkt über die Zeichen der Stringvariablen word.

While-Schleife

Im Gegensatz zu for-Schleifen terminieren while-Schleifen erst, wenn eine Stoppbedingung erfüllt ist.

word = 'spam'
i = 0

while i < len(word):
  print(word[i])

Ausgabe:

s
p
a
m

Mit einer niemals erreichten Stoppbedingung läuft eine while-Schleife endlos.

while True:
  print('spam')

Eine solche Endlosschleife kann durch das Drücken der Tastenkombination STRG + c beendet werden.

continue und break

Mittels break wird die Schleifenausführung vorzeitig abgebrochen.

i = 0
while True:
  if i >= 2:
    break
  i += 1
  print('spam')

In obigem Code wird spam drei mal ausgegeben. Danach hat i den Wert 2 und die Schleife terminiert mit break. Im Gegensatz dient continue dem Überspringen einer Schleifeniteration.

for in in (0, 1, 2):
  if i == 0:
    continue
  print("spam")

Hier wird spam nur zwei mal ausgegeben, da für den Wert i = 0 der continue folgende Code in der Schleife übersprungen wird.

Listenabstraktion

Listenabstraktion (list comprehension) bezeichnet eine elegante Methode zum erzeugen und modifizieren von Listen. Dabei werden for-Schleifen mit bedingten Anweisungen kombiniert, um Listen zu filtern und zu modifizieren.

liste = [x/2 for x in [2, 3, 4, 5] if x % 2 == 0]
print(liste)

Ausgabe:

[1.0, 2.0]

In diesem Beispiel werden alle x einer Liste von Integerwerten ausgewählt, die durch zwei ohne Rest teilbar sind. Anschliessend werden diese Werte für die neue Liste durch zwei geteilt.