wget ile Web Sitesi Kopyalama
Linux un en sevdigim komutlarından birisi “wget” komutudur. Çok basit anlamda Linux console da dosya çekmek için kullanılan wget ‘in o kadar çok parametresi vardır ki ezberlenemiz mümkün değildir.
En basit kullanımıyla bir tek dosya indirmek için:
# wget http://xxx.com/dosya.zip
Eğer bir sitenin komple kopyasını almak isterseniz, çok sayıda parametre ve seçenekleriniz vardır :
# wget --recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--domains website.org
website.org
Parametrelere kısaca bakarsak:
–recursive : Alt linkleri de kopyalamasını söyler. Böylece bütün siteyi kopyalarsınız
–domains website.org: website.org dışında bağlantıları takip etme
(recursive dediğimiz için alt linkleri takip edecekti )
–page-requisites: css, resimler ve javascript gibi site icin gerekli ne varsa indir
( bütün siteyi indirmek istediğimiz için bu çok önemli )
–html-extension: dosyaları .html uzantili kaydet
(indirdiğiniz site büyük ihtimal php yada asp olabilir. linklerdeki dosya uzantılarını .html olarak değiştiriyoruz ki sitemiz statik olarak açılabilsin.)
–convert-links: linkleri offline yani kendi bilgisayarınızda çalıştırabilmeniz için değiştirir.
(örneğin; http://website.org/test/deneme.php seklinde bir link /test/deneme.html şekline çevrilir. — uzantı html-extension parametresi yüzünden değişti )
–no-clobber: tekrarlayan linkler için aynı dosyayı defalarda almasın diyoruz
Bunun dışında iki önemli parametre vardır, bunlara da gerek duyulabilir :
# wget --recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.website.org/tutorials/html/
–no-parent: /tutorials/html/ dizini dışında ki linkleri takip etme. Yani www.website.org/tutorials/ ve kök dizin www.website.org altında yer alan dosyaları indirme diyoruz.
–restrict-file-names=windows : dosya adllarını windows da çalışacak sekilde değiştirir. eğer kopyaladığınız siteye Windows makinaan bakacaksanız bu parametreye gerek olabilir.
Aklınıza yanlış bir kafiye gelmesin, sadece öğrenmek için kullanınız… 🙂
Recent Comments