Beiträge mit Tag ‘grep’

Bash: NL (Numbering Lines)

Um eine Text-Datei mit Zeilennummern zu versehen gibt es viele Möglichkeiten. cat, awk, sed, less, grep und nl.
Hier mal ein Beispiel mit nl :

nl -b a input-datei.txt 

Unter meinem OSX ist offensichtlich die Option a als default eingestellt. Wie auf dem Screenshot zu erkennen ist, werden auch ohne extra einstellen auch die leeren Zeilen entsprechend nummeriert.

Mailadresse von Webseiten ermitteln

Hier möchte ich kurz aufzeigen, wie einfach es ist von Webseiten die Mailadresse aus dem Code zu extrahieren und evtl. für SPAM weiter zu verwenden.

curl -# https://www.daserste.de/specials/service/ard-links-adressen-100.html | grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" | sort | uniq

Zuerst verwenden wir den Befehl curl um den html-Code auszugeben. Diesen „schicken“ wir dann weiter zu grep, der mit dem Pattern für gültige Mailadressen dieses aus dem Code extrahiert. Zur besseren Übersicht wird das Ergebnis von grep noch sortiert (sort) und eventuell doppelte Einträge entfernt (uniq).

Wer das öfters zu Demonstrationszwecken tun möchte, der kann auch gerne eine kleine Funktion in .profile abspeichern.

function get-mailadr-from-website {
	curl  -# $1 | grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" | sort | uniq		 
}