[Lugor] Hilfe bei wget mit reject-regex
s.abeln at freenet.de
s.abeln at freenet.de
Do Nov 9 06:48:11 CET 2017
Guten Morge Holger,
das Problem ist ja, dass vor und hinter dem regulären Ausdruck noch was steht.
Die 9 stellige Zahl steht teilweise am Anfang oder mittendrin, z.B.
123456789.html
laptop-123456789.jpg
Viele Grüße
Stefan
-----Ursprüngliche Nachricht-----
Von: "Holger Jakobs" [holger at jakobs.com]
Gesendet: Mi. 08.11.2017 20:07
An: linux at lugor.de, "Stefan Abeln" [s.abeln at freenet.de], nluug.de at mylinuxtime.de
Betreff: Re: [Lugor] Hilfe bei wget mit reject-regex
Mit einem Wiederholungsfaktor (?, *, +) darf ein regex niemals beginnen. Was sollte er auch wiederholen?
Am 8. November 2017 19:30:34 MEZ schrieb Stefan Abeln :Hi,
ich brauche mal eure Hilfe.
Mit wget möchte ich eine Webseite lokal spigeln, aber einige Dateien
möchte ich nicht runterladen.
Das soll ja mit reject-regex gehen, ich habe es aber nicht hinbekommen.
Die Dateien, die ich nicht herunterladen möchte haben alle eine 9
stellige Zahl in Dateinamen, sind aber in unterschiedlichen Verzeichnissen.
Ich habe schin verschiedenes versucht, allerdings ohne Erfolg:
*[0-9]+*
*[0-9]{9,9}*
*[0..9]+*
*[0..9]{9,9}*
*[0..9][0..9][0..9][0..9][0..9][0..9][0..9][0..9][0..9]*
*[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]*
*[[:digit:]]{9,9}*
Das Ganze mit und ohne Ticks und Quotes.
Der wget-Aufruf sieht dann mit den unterschiedlichen regulären
Ausdrücken zum Beispiel so aus:
wget -k -E -D www.labdoo.org --recursive --reject-regex
'*[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]*'
https://www.labdoo.org/wiki-index/
Kann mir jemand helfen?
Grüße
Stefan
Mailingliste der Linux Usergroup Oberhausen
Rheinland (LUGOR) e. V.
linux at lugor.de
http://mailman.mylinuxtime.de/mailman/listinfo/linux
--
Holger Jakobs, Mülheimer Str. 133, 51469 Bergisch Gladbach
* von unterwegs gesendet, daher kurz
* sent from mobile, therefore short *-----Ursprüngliche Nachricht Ende-----
Schon gewusst?! Neben dem E-Mail-Postfach bietet freenet.de auch eine integrierte Cloud-Lösung mit 2 GB Speicher und das alles komplett kostenfrei.
https://email.freenet.de/index.html
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://mailman.mylinuxtime.de/pipermail/linux/attachments/20171109/e455dd33/attachment.html>
Mehr Informationen über die Mailingliste linux