Skocz do zawartości

Rekomendowane odpowiedzi

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

  • Popularne tematy

  • Najnowsze posty

    • O Jezusie Nazarejski.   Jedyna gorsza opcja to jakby tam jeszcze było @crush.
    • U mnie cutsceny wyglądają jak poniżej:     FPS dropi i jakieś glitche graficzne na dodatek wyskakują. Nie bardzo chce się to oglądać.
    • To casuale i kupują PS5 jak Odin by grać 20 godzin rocznie.   Przy premierze była afera - testy, że te pady wytrzymają 470h, nie wiem na ile to się sprawdza, ale dla mnie to 3 miesiące, a dla casuala wiele lat. Pad do N64 to awaryjność kosmiczna, choć tylko analoga (reszta bezawaryjna), niemal 100% padów używanych zepsutych (gałka wychylona w bok bardziej lub mniej), od biedy da się grać i na takich grali (a nowego nie sposób było kupić, jeśli już to w kosmicznej cenie bliskiej konsoli).
    • HTTrack jest o tyle fajny, że kopiuje witrynę dokładnie tak, jak wygląda i zapisuje także zewnętrzne obrazki. Można potem wygodnie przeglądać całe forum offline.   Jak się przygotować: szybkie łącze dużo miejsca na dysku (2 TB lub więcej) lub: dysk zewnętrzny (zalecana opcja) domowy serwer NAS WinHTTrack Do programu jest dołączona instrukcja - po uruchomieniu wciskamy F1. Klikamy pierwszy link pod "How to use". Bardzo fajny jest też rozdział "How not to use", czyli czego nie robić. Wszystko jest po angielsku, a kto nie umie angielskiego, to niżej w tym wątku będzie opis po polsku.     Po uruchomieniu programu klikamy Dalej i pojawia nam się ekran, w którym podajemy: nazwę projektu (jeśli zaczęliśmy już robić kopię, to wybieramy nasz projekt z listy) kategorię projektu - można wpisać cokolwiek (np. Forum)   Klikamy Dalej i musimy wybrać sposób działania programu. Nas będą interesować dwie opcje: Pobierz stronę(y) Web - jeśli zaczynamy tworzyć lustro lub aby stworzyć je od nowa Wznów tworzenie lustra - jeśli przerwaliśmy tworzenie kopii i chcemy kontynuować Podajemy adres lub adresy URL, które chcemy skopiować, w tym przypadku forum PCLab.     Klikamy "Ustaw opcje", bo trzeba dodać wyłączenia.    Jak widać na zrzucie ekranu, w zakładce Filtry są wyjątki, gdzie robot ma się nie zapuszczać. Nie mam gotowej listy i być może takie latają po sieci dla każdego silnika forum. Trzeba ręcznie wejść na stronę i poszukać linków, których bot nie powinien klikać. Cel jest taki, aby nie ściągać wiele razy tych samych tematów lub zignorować niektóre podstrony. Nawet bez tych wyjątków HTTrack powinien poradzić sobie z forami na silniku Invision Community, ale na innych silnikach się zapętlał. Jeśli zaobserwujecie taką sytuację, że ciągle ściągane są te same podstrony, bo mają różne URL-e, to przerwijcie kopiowanie i dodajcie kolejne filtry.     W kolejnej zakładce Ograniczenia możemy ograniczyć: głębokość - zostawiamy puste pole głębokość zewnętrzna - wpisujemy 0 pozostałe pola zostawiamy puste Forum nie miało ograniczenia ilość zapytań / IP, ale są strony, co używają WAF, np. Cloudflare i jak będziecie walić zbyt szybko, to wyświetli się captcha lub serwer zablokuje wasz IP. Może też wykryć zautomatyzowany ruch przez analizę zachowań. Wtedy warto ograniczyć częstotliwość.     W zakładce Kontrola przepływu N# połączeń ustawiamy na 10 lub więcej, jeśli zależy nam na czasie.     W zakładce Łącza zaznaczamy pierwszą opcję. Interesująca jest też ostatnia opcja. Nie zaleca się jej włączać, bo jeśli nie zdążymy wykonać kopii wszystkich plików HTML, to nie będziemy mieć żadnych obrazków, stylów, tak że strona się posypie po otwarciu offline. Pobierajmy wszystko od razu.     W zakładce Struktura możemy pozostawić wszystkie opcje wyłączone. Opis: Bez stron z błędami - jeśli jakiś link prowadzi do nieistniejącej strony lub serwer zwróci kod błędu, np. 404 Not Found, to HTTrack nie stworzy dedykowanej strony z ostrzeżeniem Bez stron zewnętrznych - dla wszystkich linków zewnętrznych, które nie zostaną zarchiwizowane, HTTrack stworzy stronę z ostrzeżeniem, że należy przełączyć się w tryb online Schowaj paski zapytań - nie dołącza parametrów po pytajniku do nazw plików, bo starsze przeglądarki mają problem z otwieraniem takich plików - w przypadku PCLaba można włączyć (zaznaczyć ptaszka), bo Invision Community używa tzw. przyjaznych adresów (mod_rewrite) Nazwy ISO9660 - jeśli chcemy wypalić kopię na CD Nazwy DOS-owe - relikt przeszłości   W zakładce Poszukiwacz (Pająk) zaznaczamy opcje jak na zrzucie ekranu:     W zakładce ID przeglądarki warto ustawić innego user-agenta niż HTTrack. Wpisz w Google "jaki jest mój user agent" i skopiuj odpowiedź do pola "Identyfikacja". Opis opcji: Identyfikacja - jak robot się przedstawia (na zrzucie ekranu podszywamy się pod Chrome) Stopka HTML - wybieramy (none), nie chcemy wstawki "Mirrored by HTTrack" w każdym pliku Languages - zostawiamy pl, en, * Additional HTTP Headers - jeśli chcemy być zalogowani, to kopiujemy wybrane nagłówki z przeglądarki, szczególnie Cookie: (można to sprawdzić w narzędziach deweloperskich - F12 lub CTRL+SHIFT+I) Default Referrer URL - zazwyczaj nie ma potrzeby uzupełniania    W zakładce Raport, indeks, cache ustawiamy wszystko jak na zrzucie ekranu. Utwórz indeks - tworzy index.html z listą pobranych witryn Utwórz bazę słów - tworzy index.txt z listą słów - tylko spowalnia pracę   No i to wszystko. Klikamy OK, aby zapisać zmiany w ustawieniach.   Ostatni etap to okienko jak poniżej. Kilka opcji, które mogą się niektórym przydać, w tym wyłączenie komputera po skończeniu wykonywania kopii.     Klikamy Zakończ. Program rozpocznie pobieranie plików.   Moment, chcesz właśnie odejść od komputera i wrócić za kilka dni? A jaką masz pewność, że wszystko dobrze ustawiłeś, że robot sobie radzi, a serwer nie blokuje możliwości wykonania kopii?   Przez jakiś czas obserwuj, co się dzieje. Zwróć uwagę, czy: pająk nie zaplątuje się we własną sieć (odwiedza wielokrotnie te same strony) program nie buszuje tam, gdzie nie powinien (np. strony tylko dla zalogowanych) program nie blokuje się na czymś (np. na zewnętrznych obrazkach) Co jakiś czas obserwuj pracę programu. Otwórz kopię lokalnie i sprawdź: czy da się przechodzić między podstronami czy linki działają prawidłowo czy zewnętrzna zawartość jest osadzona Jeśli wszystko jest OK, to prawdopodobnie będziesz się cieszył kopią offline dokładnie tak jak wygląda.   Szkoda, że ten poradnik nie powstał miesiąc wcześniej. Szukałem innych skryptów. HTTrack mógłby przez rok ściągać forum. Nie odpaliłem, bo kończyło się miejsce na dysku. Później zająłem się innymi tematami i totalnie zapomniałem o PCLabie. Zapuściłem dopiero dzień przed zamknięciem i HTTrack radził sobie całkiem dobrze. Inne skrypty pobierają samą treść i zapisują np. w formacie wątku na grupie dyskusyjnej. Natomiast HTTrack zapisuje witrynę w oryginale, ze wszystkimi stylami i obrazkami (nawet zewnętrznymi na innych hostingach) i potem można taką kopię przeglądać offline. Udało się przez noc zedrzeć 2 GB, niestety tylko pojedyncze strony wątków z pierwszych stron, a dużo było tematów do zachowania. Możecie bić.    Próbuję dotrzeć do osób, co umiały się posługiwać tym szatańskim wynalazkiem i skopiowały większą część forum. Jeśli nie, to pozostaje nam to, co udało się w różny sposób pobrać + Internet Archive.
    • Muszę odszukać piosnkę, którą dla mnie odspiewał Matriks_1111, chyba było tam też na temat mytha(jak nie pomieszałem).. obu nie ma
  • Aktywni użytkownicy

×
×
  • Dodaj nową pozycję...