Skocz do zawartości

Przywrócili w samą porę Web Archive - Forum PCLAB.PL


Tombycz

Rekomendowane odpowiedzi

Dziękuję Tombycz. Trzeba nagłaśniać wskazówkę jak przeglądać Web Archive. Wyszukiwarka nie działa z racji, że to statyczne strony.

 

Poniżej cytuję swoje wypowiedzi z PCLaba i ITHardware, bo nie chce mi się pisać po kilka razy :E

 

14 godzin temu, Filip454 napisał:

Uff, przeczytałem cały temat na szybko.

Z jednego się cieszę - przywrócili w samą porę Web Archive, aż dziw, prawie jakby na tę okoliczność.

http://web.archive.org/web/20240126022104/https://forum.pclab.pl/

Dobrze, że scrawlowane forum 👍🤝

Long live Web Archive i PCLab ❤️

Nie wszystko pójdzie do śmietnika 🙏

Źródło: Forum PCLab.pl

 

15 minut temu, Filip454 napisał:

Nie przepadnie nic, wszystko prawie na Web Archive. Tylko, że już pierwszy atak na nie był, także doceniajmy dobrodziejstwa tych czasów, bo jak widać wszystko szybko przepada.

 

Ale dziwne, bo przywrócili archiwum do życia w sam raz na upadek PCLab kompletny :E

 

Protip dla zapaleńców: jak chcecie skopiować całą swoją zawartość, to wyświetlacie listę swoich odpowiedzi w profilu, zapisujecie wszystko do MHTML i potem bierzecie linki i sobie wklepujecie do Web Archive i możecie patrzeć wszystkie tematy, w których się udzielaliście. Na tej podstawie moglibyśmy zbudować spis treści z najważniejszych tematów na PCLab w oparciu o Web Archive właśnie. Wtedy sobie mogą nawet usuwać z serwera i kombinować, a nic Was nie powstrzyma, by poczytać stare posty.

 

Edytowane przez Filip454
  • Like 1
  • Upvote 1
Odnośnik do komentarza
Udostępnij na innych stronach

Gdyby ktoś zbudował odpowiedni indeksator, to bez wątpienia istnieje możliwość zrobienia pełnego lustra. To tylko kwestia czasu, a czasu takiego właśnie braknie, bo jest tylko miesiąc.

 

Nawet na najszybszym dostępnym łączu to jest raczej niemożliwe.

 

Dlatego wczoraj wpadłem na pomysł założenia tematu będącego swoistym spisem treści i razem byśmy stworzyli archiwum wątków, które były najważniejsze dla ogółu PCLaba. Moim zdaniem warto. Wczoraj już nie miałem siły, bo na dwa dni mnie wykopało z butów przez to wszystko. Człowiek przecież musi za coś żyć :E

 

Wczoraj w momencie pisania to po prostu już pękłem i do spania poszedłem. Natomiast zamysł jest prosty - każdy by postował na dole, a AI lub algorytm dodawałby do pierwszego postu. W ten sposób można wspólnie tworzyć backup.

 

Najlepiej to byłoby, gdybyśmy wątki kopiowali i potem pisali post w jakimś wzorze. Potem do pierwszego postu w temacie, AI lub algorytm dodawałby wszystko do odpowiedniej kategorii. Tylko łatwo wskazywać paluszkiem, a trudniej zrealizować. Trzeba mieć trochę sprytu niestety. Jednak czuję jakiś bodziec po tylu latach, który każe mi zrobić coś w tym kierunku, ale sam nie ma opcji bym dał radę. To niemożliwe w 30 dni.

 

Ogólnie to perspektywa backupu jest raczej smutna.

Edytowane przez Filip454
Odnośnik do komentarza
Udostępnij na innych stronach

Tombycz, a może zmienimy nazwę tematu na np. Kopia zapasowa PCLab.pl - baza danych, czy coś w tym stylu?

 

No po 29 zniknie z sieci, dlatego proponowałem byśmy do tego czasu zaczęli robić kopie zapasowe indywidualnie i postowali w tym wątku, potem się to zbierze do kupy.

 

Tylko nie dawajcie plików na ITH, a na jakieś dyski internetowe.

 

Kurczę, gdyby ktoś mi pomógł i razem robił ze mną to byśmy dali radę najważniejsze wątki skopiować. Tylko chcę jakąś instrukcję prostą sformułować, żeby to było w miarę jednolite. To wszystko jest wykonalne, tylko za dużo spraw jest na głowie w tej chwili...

 

Na razie prośba ogromna do wszystkich - wklejajcie tu same odnośniki do najważniejszych tematów na PCLab według Was. To jest podstawa, byśmy stworzyli jakikolwiek indeks najważniejszych danych.

Edytowane przez Filip454
Odnośnik do komentarza
Udostępnij na innych stronach

Ten program nie nadaje się do kopiowania dynamicznego forum.

 

Ja wiem jak to zrobić, tylko po prostu fizycznie sam tego nie jestem w stanie zrobić, nawet 200 tematów w miesiąc. Musiałbym być sztuczną inteligencją z przyszłości :E

 

Dlatego jak znasz jakieś tematy, które warto skopiować to wklejaj linki i wszyscy inni również.

 

Żebyśmy wspólnie robili to trzeba inny model działania. Instrukcję mam na końcu języka, tylko chcę to najpierw posprawdzać, by każdemu było łatwo. Najlepiej jakby się tylko link wklejało i czekało :E

Edytowane przez Filip454
Odnośnik do komentarza
Udostępnij na innych stronach

7 minut temu, Filip454 napisał:

Ten program nie nadaje się do kopiowania dynamicznego forum.

 

Skopiowanie forum dynamicznego może być nieco skomplikowane, ponieważ dynamiczne strony często generują zawartość na żywo za pomocą JavaScript. Jednak istnieje kilka metod, które mogą pomóc:

Narzędzia do kopiowania stron internetowych: Możesz użyć narzędzi takich jak HTTrack lub WebCopy, które pozwalają na kopiowanie całych stron internetowych, w tym dynamicznych forum.

Skrypty Python: Możesz napisać skrypt w Python za pomocą bibliotek takich jak BeautifulSoup czy Scrapy, które pozwalają na wykrywanie i kopiowanie zawartości z dynamicznych stron.

Narzędzia do web scraping: Istnieją narzędzia online, które umożliwiają kopiowanie zawartości z dynamicznych stron internetowych, takie jak Octoparse czy ParseHub.

Edytowane przez Tombycz
Odnośnik do komentarza
Udostępnij na innych stronach

Scraping for nawet jeśli nie są dynamiczne wychodzi strasznie lipnie niestety. :/ No i kwestia tego, ile to by czasu zajęło. Niedawno ściągałam forum które ma może z 500MB wszystkiego, to nie dość że szło pół dnia i całą noc, to nie pobrało całości, a to, co pobrało, to zapisało według własnego widzimisię. Skończyło się tak że i tak na gwałt wszyscy robiliśmy backupy na webarchive, a ważniejsze strony sobie do PDFa drukowaliśmy z widokiem 1000 postów na stronę :E 

Odnośnik do komentarza
Udostępnij na innych stronach

  • tomcug przypiął/eła ten temat
10 godzin temu, Filip454 napisał(a):

Czyli w HTTrack robione?

 

Posłuchaj Wu, planuję po prostu wspólne utworzenie w jednym miejscu tego.

 

Trudno jest ze względu na zdrowie, ale dam radę.

Coś w tym rodzaju mam ale inny soft + swoje skrypty żeby ładnie latało po forum.

Wrzucaj co ważniejsze tematy, upewnię się że ich nie ominę

Odnośnik do komentarza
Udostępnij na innych stronach

10 minut temu, Camis napisał(a):

Chyba że jakiś "haker" anonimowo udostępni :Up_to_s:

"Materiały z pclabu... tanio... off polityczny... intel 15gen... tanio tanio, materiały z pclabu... tanie granie, bicie rekordu 3, prezentujemy nasze maszynki.. tanio, materiały z pclabu, tanio"

> KLIK <

;) 

Odnośnik do komentarza
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
  • Ostatnio przeglądający   1 użytkownik

×
×
  • Dodaj nową pozycję...