Git

Aus Data-Science-Lernen-Wiki
Version vom 22. November 2022, 14:27 Uhr von Jo Bergs (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „<!-- Einleitung ANFANG --> <div id="einleitung"> <h2 class="w3-text-teal">Einleitung</h2> [https://git-scm.com Git] ist eine Versionsmanagement-Software, mit d…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Einleitung

Git ist eine Versionsmanagement-Software, mit der in der Softwareentwicklung der Code einfach auf frühere Versionen zugegriffen werden kann und neue Versionen der Anwendung gespeichert werden können. Dabei ist auch Ziel, Entwickler unabhängig an verschiedenen Teilen der Anwendung mit einer minimalen Anzahl von Merge-Konflikten (unterschiedlichen Varianten von Code in der gleichen Version) arbeiten zu lassen.

Entwickelt wurde Git von Linus Torvalds ab 2005, da er die Effizienz der frei verfügbaren Versionsmanagement-Software für die Weiterentwicklung des Linux-Kernels als nicht ausreichend befand. Ein großer Unterschied von Git zu anderer Versionsmanagement-Software ist, dass Git alle Arbeitsschritte aller Entwickler in einer gemeinsam genutzten Baumstruktur zusammenfasst, von dem jeder Entwickler ein Klon für lokale Weiterentwicklung hat.

69% aller Projekte auf Open Hub werden mit Git gemanagt. Git ist ausreichend Leistungsstark für das Versionsmanagement ganzer Betriebssysteme; sowohl Linux als auch Windows verwenden Git.

Insgesamt ist Versionsmanagement ein zentrales Element moderner, kollaborativer Softwareentwicklung, auf das kaum verzichtet werden kann. Glücklicherweise reicht die Kenntnis einiger Basisfunktionen und Konzepte von Git für einen Einstieg in das Versionsmanagement aus, welche im folgenden vorgestellt werden.


Installation

Windows

Ein Installer für Windows wird auf der offiziellen Webseite von Git zur Verfügung gestellt.

Mac-OSX

Die Installation auf Mac/OSX erfolgt via Homebrew:

brew install git

Ubuntu Linux

Auf Ubuntu Linux wird git mit apt installiert:

sudo apt update
sudo apt install git


Grundlagen

Alle Entwickler des Projektes haben eine lokale Kopie der gesamten Versionshistorie, an der sie Änderungen vornehmen können. Dabei kann die Versionshistorie entweder lokal gespeichert werden oder auf einem Online-Hoster wie GitHub.
verwaltet werden. Letzteres, das Online-Hosting von Git-Versionshistorien, ist natürlich unerlässlich bei Kollaboration übers Internet.
Ein Satz von zusammengehörigen Änderungen wird als Commit bezeichnet und mit einer passenden Nachricht versehen, beispielsweise "Alle Buttons blau gefärbt". Diese Commits können dann mit einem push in die in einem Repository gespeicherte globale Versionshistorie integriert werden. Dabei sollten folgende Leitgedanken berücksichtigt werden:

  • Zusammengehörige Änderungen commiten
  • Häufig commiten
  • Nur abgeschlossene Änderungen commiten
  • Vor dem Commit testen
  • Prägnante Commitbeschreibungen

Falls dabei Commits von verschiedenen Entwicklern auf die selbe Datei fallen, können Merge-Konflikte auftreten. Ein Merge-Konflikt liegt dann vor, falls Änderungen nicht nur in der gleichen Datei, sondern auch in der gleichen Zeile vorliegen. Zur Auflösung von Merge-Konflikten gibt es Werkzeuge, gegebenenfalls kann aber manuelle Intervention nötig sein. Von Bedeutung ist auch der Status des Entwicklers. Hat der Entwickler den Status Collaborator, so kann er seine lokalen Änderungen direkt auf das Repository pushen. Andernfalls muss der Entwickler einen pull request abgeben, woraufhin ein Collaborator die Änderungen entweder in das Repository integrieren oder verwerfen kann.
Ein weiteres, leistungsfähiges Werkzeug der Versionskontrolle ist das Speichern verschiedener Versionen einer Software als sogenannte Branches. Branches können unter anderem für Versionen für verschiedene Betriebssysteme oder für stabile oder experimentielle Versionen angelegt werden.
Zusätzlich können einzelne Commits mit einem benannten Tag versehen werden, auf das zu einem späteren Zeitpunkt einfach zugegriffen werden kann.


Verwendung

Repositories erzeugen

Neue Git-Repositories werden so erzeugt:

mkdir projekt && cd projekt
git init

Soll statt dessen ein bereits vorhandenes Repository geklont werden, so ist folgendes einzugeben:

git clone ssh://nutzer@domain.com/repository.git

Anstelle von SSH kann auch HTTPS als Protokoll verwendet werden, je nachdem, wo das Repository liegt.

Lokale Änderungen

Das entweder lokal gespeicherte oder geklonte Repository kann jetzt lokal bearbeitet werden. Mit

git diff

werden alle Änderungen an lokalen Dateien seit dem letzten Commit angezeigt. Der folgende Befehl fügt dem nächsten Commit alle Änderungen inklusive neuer Dateien im aktuellen Verzeichnis hinzu:

git add .

Sind alle Änderungen erfolgt, kann commitet werden. Dies erfolgt durch die Eingabe von

git commit -am"Nachricht"

mit einer möglichst präzisen, aber kurzen Commit-Message. Sollen weitere Änderungen dem letzten Commit hinzugefügt werden, ist

git commit --amend

Waren die Änderungen nicht hilfreich, so können sie verworfen werden mit

git stash

Commitverlauf

Versionsmanagement benötigt effektiven Zugriff auf die Versionshistorie einer Software. Mit git log wird der Commitverlauf ausgegeben, gegebenenfalls beschränkt auf eine Anzahl zuückliegender Commits mit einem Parameter:

git log
git log -n5

Der zweite Befehl zeigt nur die letzten fünf Commits an. Weiterhin kann die Historie nur einer bestimmten Datei angezeigt werden:

git -p DATEIPFAD

Möchte man wissen, wer an einer Datei gearbeitet hat, hilft blame weiter:

git blame DATEIPFAD

Branches und Tags

Mit Branches uns Tags kann einfach zwischen verschiedenen Versionen und Zwischenstufen einer Software gewechselt werden.

git branch -av
git tag

Der erste Befehl zeigt alle Branches, der zweite alle Tags an. Der folgende Befehl erzeugt einen neuen Branch namens test aus dem aktuellen Stand der Versionshistorie:

git branch test

Soll statt dessen ein Branch gelöscht werden, so ist der Parameter -d zu übergeben:

git branch -d test

Zwischen Branches wird mit checkout gewechselt:

git checkout BRANCH

Analog dazu können Tags erzeugt, ausgewählt und gelöscht werden:

git tag TAGNAME
git tag -d TAGNAME
git checkout TAGNAME

Allgemein gilt, dass Branches für stark verschiedene Versionen verwendet werden wie beispielsweise eine Linux- und eine Windowsversion, Tags hingegen eher für kleine Änderungen wie Bugfixes und ähnliches.


Aktualisieren und Publizieren

Git Repositories werden entweder lokal abgelegt oder remote auf einem Server wie GitHub gespeichert. Die derzeit aktiven Remote-Verbindungen werden folgendermaßen angezeigt:

git remote -v

So werden die Daten einer Remoteverbindung namens REMOTE mit show ausgegeben:

git remote show REMOTE

Eine neue Remoteverbindung namens REMOTE mit der Ziel-URL als Parameter wird mit add eingerichtet:

git remote add REMOTE URL

Wenn ein anderer Entwickler Änderungen eines Branch BRANCH in das Projekt integriert hat, so können diese Änderungen mit pull in die eigene, lokale Kopie der Versionshistorie integriert werden:

git pull REMOTE BRANCH

Analog dazu werden mit push eigene Commits des bearbeiteten Branches hochgeladen:

>git push REMOTE BRANCH

Tags müssen seperat hochgeladen werden:

git push -tags

Soll eine Branch im remote Repository gelöscht werden, kann dies so erfolgen:

git branch -dr REMOTE/BRANCH

Merge und Rebase

Merge bezeichnet die Integration eines Branches in die eigene, lokale Entwicklungshistorie. Ein Rebase ist statt dessen die Integration der lokalen Entwicklungshistorie in einen anderen Branch.

git rebase BRANCH

Treten Konflikte auf, so kann das Rebase abgebrochen werden:

git rebase -abort

So können erst Merge-Konflikte aufgelöst werden, bevor das Rebase mit -continue fortgesetzt wird:

git rebase -continue

Wenn zwei Entwickler in ihren Commits an der gleichen Datei gearbeitet haben, so entsteht ein Merge-Konflikt. Diese können beispielsweise mit dem Git mergetool aufgelöst werden:

git mergetool

Wurden die Konflikte aufgelöst, so muss die entsprechende Datei wieder git hinzugefügt werden:

git add DATEI

Änderungen verwerfen

Für den Fall, dass die vorherigen Änderungen sich als nicht hilfreich erweisen, bietet Git zahlreiche Möglichkeiten, diese zu verwerfen.

git reset –hard HEAD

Obiger Befehl verwirft alle lokalen Änderungen seit dem Commmit HEAD. HEAD ist hierbei ein alphanumerischer Kennzeichner, wie angezeigt durch git log. Vorsicht: die verworfenen Änderungen können nicht wiederhergestellt werden! Sollen statt dessen nur die lokalen Änderungen einer spezifischen Datei verworfen werden, kann checkout verwendet werden:

git checkout HEAD DATEI

Ausserdem können auch alle lokalen Änderungen mit einem neuen Commit verworfen werden:

git revert COMMIT


Glossar

Blame (hier: Verantwortung)

Mit dem Befehl Blame wird für jede Zeile einer Datei angezeigt, wer wann die letzte Veränderung daran vorgenommen hat.

Branch (Zweig)

Bei der Entwicklung einer Software kann es erforderlich sein, verschiedene Versionen in der Form von Branches parallel zu entwickeln und zur Verfügung zu stellen. Beispielsweise kann ein Branch zum sicheren Experimentieren mit neuen Komponenten angelegt werden (häufig dev genannt), oder es können parallel Versionen für Python2 und Python3 angelegt werden.

Checkout (etwa: Wechsel)

Der Befehl zum Wechsel auf einen anderen Branch. HEAD und Index werden dabei auf den gewählten Branch gesetzt.

Cherry-pick (etwa: Rosinen rauspicken)

Mit einem Cherry-pick wird ein spezifischer Commit eines Branches auf einen anderen Branch angewendet. Dies kann unter anderem zum Einbringen eines Commits in den Ziel-Branch genutzt werden, nachdem der Commit auf einen falschen Branch ausgeführt wurde.

Clean (sauber)

Ein Working Directory ist Clean, wenn keinerlei Abweichungen zum letzten Commit vorliegen, das heisst keine Dateien verändert wurden.

Clone (Klonen)

Der Befehl Clone erlaubt das Herunterladen eines gesamten Repositories auf einen Computer, auf dem ein Entwickler dann lokale Modifikationen vornehmen kann, die anschließend in das Master-Repository auf dem Server integriert werden.

Collaborator (Mitarbeiter)

Alle Entwickler eines Repositories, die über Lesund Schreibrechte verfügen.

Commit (Übergabe)

Ein Commit speichert den aktuellen Stand des Working Directories, also die jüngst vorgenommenen Modifikationen, zusammen mit einer beschreibenden Nachricht und weiteren Metadaten wie Datum, Uhrzeit und Autor als den nächsten Arbeitsschritt in der Historie.

Contributor (Beitragender)

Ein Entwickler, dessen Pull Request in das Repository integriert wurde, der aber kein Collaborator ist.

Diff (Differenz)

Die Anzeige der Unterschiede zwischen zwei Dateien. Wird benutzt, um Bugs zwischen verschiedenen Commits aufzuspüren.

Forking (Gabelung)

Forking bezeichnet das Klonen eines Online-Repositories für das eigene Benutzerkonto. Damit können Entwickler unabhängig an einem Projekt arbeiten, ohne Teil der ursprünglichen Entwicklergruppe zu sein, beispielsweise um die Software für ein anderes Betriebssystem zu portieren.

HEAD (Kopf)

Ein Zeiger auf den aktuellen Commit des derzeitigen Branches. Üblicherweise der jüngste Commit des Branches, kann aber mit Git-Befehlen versetzt werden, um auf ältere Commits zuzugreifen.

Index

Index bezeichnet die Vorbereitung des Working Directory vor einem Commit. Dabei wird ausgewählt, welche geänderten oder neu erstellten Dateien dem Commit hinzugefügt werden.

Issue (Angelegenheit)

Finden Nutzer eines Repositories einen Bug oder wünschen eine Erweiterung der Software, können sie auf GitHub eine Issue eingeben, die dann von den Entwicklern entweder bearbeitet oder zurückgewiesen wird.

Log

Log dient der Darstellung der Commit-Historie des aktuellen Branches.

Markdown

Markdown ist eine einfache Formatierungssprache für Textdateien, mit der häufig README-Dateien formatiert werden.

Merge (Vereinigung)

Im üblichen Arbeitszyklus wird zuerst ein Pull ausgeführt, damit der lokale Klon des Repositories auf dem neusten Stand ist. Anschliessend werden lokale Modifikationen vorgenommen, die dann anschliessend mit einem Commit und Push in das Online-Repository integriert werden. Dabei wird ein Merge durchgeführt - die neuen Programmteile werden integriert. Wenn allerdings zwei Entwickler an den gleichen Programmteilen gleichzeitig lokal gearbeitet haben, kann dabei ein Merge-Konflikt auftreten, da das Online-Repository nicht weiß, welche Teile übernommen werden sollen. Üblicherweise müssen derartige Merge-Konflikte manuell aufgelöst werden.

Parent (Elter)

Parent ist eine Liste mit allen logischen Vorgängern eines Commits.

Pull (Ziehen)

Durch Pull werden alle Änderungen, die im Master-Repository von anderen Entwicklern vorgenommen wurden, aber nicht im lokalen Klon enthalten sind, auf das lokale Repository angewendet.

Push (Stoßen)

Mit einem Push werden alle zuletzt vorgenommenen Commits dem Repository des Projektes hinzugefügt, entweder auf einem Server wie beispielsweise GitHub oder in einem lokalen Repository auf der Festplatte.

Rebase

Bei einem Rebase werden die Änderungen eines Branches auf einen anderen Branch angewendet, beispielsweise von einem experimentiellem Branch auf Master. Anschließend kann der experimentielle Branch in Master gemerged werden, wodurch im Gegensatz zu einem direkten Merge eine lineare Entwicklungshistorie ensteht.

Repository (Ablage)

Ein Repository beinhaltet ein Projekt mitsamt seiner Entwicklungshistorie. Das heisst, alle Zwischenschritte (in Form von Commits) der Software können wiederhergestellt oder betrachtet werden. Im Fall von Git wird unterschieden zwischen einem meißt online verfügbaren Master-Repository und lokalen Klonen bei allen beteiligten Entwicklern, die so unabhängig voneinander an dem Projekt arbeiten können.

Resolve (Auflösen)

Resolve bezeichnet das manuelle Auflösen von Merge-Konflikten.

Rewind (Zurückspulen)

Mit einem Rewind wird der HEAD auf einen früheren Commit zurückgesetzt und die Arbeit bis zu diesem Commit verworfen.

SHA-1

Mit SHA (Secure Hash Algorithmus) werden Prüfsummen für digitale Informationen erstellt. Die Prüfsumme hat immer 40 hexadezimale Zeichen. In Git wird SHA verwendet, um Commits zu benennen. Somit kann die Validität eines Commits anhand seines Namens überprüft werden.

Tag (Markierung)

Tags sind vom Entwickler angelegte Markierungen, auf die einfach zugegriffen werden kann. Dadurch wird die Verwaltung der komplexen Entwicklungshistorie eines Projektes vereinfacht. Tags werden dazu mit Bezeichnern versehen, wie beispielsweise v1.01 oder Django statt Flask.

Upstream (Flussauf)

Synonym für das Master-Repository. Der lokale Klon eines Repositories wird auch Downstream genannt.

Versionskontrollsystem (Concurrent Version System, CVS)

Versionskontrollsysteme dienen der Verwaltung verschiedener Versionen einer Software. Bekannte CVS neben Git sind Subversion und CVS. Ein CVS speichert die gesamte Entwicklungshistorie einer Software und ermöglicht die Zusammenarbeitet mehrerer Entwickler in kollaborativen Projekten.

Working Tree (Arbeitsverzeichnis)

Der Working Tree beinhaltet alle Dateien des Projektes im derzeitigen Zustand und kann bei Bedarf vom CVS auf einen früheren Zustand zurückgesetzt werden.