Tombycz Napisano %s o %s Zgłoś Udostępnij Napisano %s o %s Przywrócili w samą porę Web Archive, mam nadzieję że nie wszystko poszło na marne do śmietnika. 2 1 Link do komentarza Udostępnij na innych stronach More sharing options...
Filip454 Napisano %s o %s Zgłoś Udostępnij Napisano %s o %s (edytowany) Dziękuję Tombycz. Trzeba nagłaśniać wskazówkę jak przeglądać Web Archive. Wyszukiwarka nie działa z racji, że to statyczne strony. Poniżej cytuję swoje wypowiedzi z PCLaba i ITHardware, bo nie chce mi się pisać po kilka razy 14 godzin temu, Filip454 napisał: Uff, przeczytałem cały temat na szybko. Z jednego się cieszę - przywrócili w samą porę Web Archive, aż dziw, prawie jakby na tę okoliczność. http://web.archive.org/web/20240126022104/https://forum.pclab.pl/ Dobrze, że scrawlowane forum 👍🤝 Long live Web Archive i PCLab ❤️ Nie wszystko pójdzie do śmietnika 🙏 Źródło: Forum PCLab.pl 15 minut temu, Filip454 napisał: Nie przepadnie nic, wszystko prawie na Web Archive. Tylko, że już pierwszy atak na nie był, także doceniajmy dobrodziejstwa tych czasów, bo jak widać wszystko szybko przepada. Ale dziwne, bo przywrócili archiwum do życia w sam raz na upadek PCLab kompletny Protip dla zapaleńców: jak chcecie skopiować całą swoją zawartość, to wyświetlacie listę swoich odpowiedzi w profilu, zapisujecie wszystko do MHTML i potem bierzecie linki i sobie wklepujecie do Web Archive i możecie patrzeć wszystkie tematy, w których się udzielaliście. Na tej podstawie moglibyśmy zbudować spis treści z najważniejszych tematów na PCLab w oparciu o Web Archive właśnie. Wtedy sobie mogą nawet usuwać z serwera i kombinować, a nic Was nie powstrzyma, by poczytać stare posty. Edytowano %s o %s przez Filip454 1 Link do komentarza Udostępnij na innych stronach More sharing options...
Kadajo Napisano %s o %s Zgłoś Udostępnij Napisano %s o %s Super sprawa, nie dajmy labowi odejść w niebyt, tyle tam cennej wiedzy. 1 2 Link do komentarza Udostępnij na innych stronach More sharing options...
Camis Napisano %s o %s Zgłoś Udostępnij Napisano %s o %s Niestety web archive ma tylko małą część stron zapisanych. Nie da się tak przeglądać całych tematów. 1 Link do komentarza Udostępnij na innych stronach More sharing options...
Filip454 Napisano 2 godziny temu Zgłoś Udostępnij Napisano 2 godziny temu (edytowany) Gdyby ktoś zbudował odpowiedni indeksator, to bez wątpienia istnieje możliwość zrobienia pełnego lustra. To tylko kwestia czasu, a czasu takiego właśnie braknie, bo jest tylko miesiąc. Nawet na najszybszym dostępnym łączu to jest raczej niemożliwe. Dlatego wczoraj wpadłem na pomysł założenia tematu będącego swoistym spisem treści i razem byśmy stworzyli archiwum wątków, które były najważniejsze dla ogółu PCLaba. Moim zdaniem warto. Wczoraj już nie miałem siły, bo na dwa dni mnie wykopało z butów przez to wszystko. Człowiek przecież musi za coś żyć Wczoraj w momencie pisania to po prostu już pękłem i do spania poszedłem. Natomiast zamysł jest prosty - każdy by postował na dole, a AI lub algorytm dodawałby do pierwszego postu. W ten sposób można wspólnie tworzyć backup. Najlepiej to byłoby, gdybyśmy wątki kopiowali i potem pisali post w jakimś wzorze. Potem do pierwszego postu w temacie, AI lub algorytm dodawałby wszystko do odpowiedniej kategorii. Tylko łatwo wskazywać paluszkiem, a trudniej zrealizować. Trzeba mieć trochę sprytu niestety. Jednak czuję jakiś bodziec po tylu latach, który każe mi zrobić coś w tym kierunku, ale sam nie ma opcji bym dał radę. To niemożliwe w 30 dni. Ogólnie to perspektywa backupu jest raczej smutna. Edytowano 2 godziny temu przez Filip454 Link do komentarza Udostępnij na innych stronach More sharing options...
Tombycz Napisano 1 godzinę temu Autor Zgłoś Udostępnij Napisano 1 godzinę temu (edytowany) Rzeczywiście działa ale co potem i dalej po 29 listopada jak zniknie z sieci? Edytowano 1 godzinę temu przez Tombycz 1 Link do komentarza Udostępnij na innych stronach More sharing options...
Filip454 Napisano 1 godzinę temu Zgłoś Udostępnij Napisano 1 godzinę temu (edytowany) Tombycz, a może zmienimy nazwę tematu na np. Kopia zapasowa PCLab.pl - baza danych, czy coś w tym stylu? No po 29 zniknie z sieci, dlatego proponowałem byśmy do tego czasu zaczęli robić kopie zapasowe indywidualnie i postowali w tym wątku, potem się to zbierze do kupy. Tylko nie dawajcie plików na ITH, a na jakieś dyski internetowe. Kurczę, gdyby ktoś mi pomógł i razem robił ze mną to byśmy dali radę najważniejsze wątki skopiować. Tylko chcę jakąś instrukcję prostą sformułować, żeby to było w miarę jednolite. To wszystko jest wykonalne, tylko za dużo spraw jest na głowie w tej chwili... Na razie prośba ogromna do wszystkich - wklejajcie tu same odnośniki do najważniejszych tematów na PCLab według Was. To jest podstawa, byśmy stworzyli jakikolwiek indeks najważniejszych danych. Edytowano 1 godzinę temu przez Filip454 Link do komentarza Udostępnij na innych stronach More sharing options...
Tombycz Napisano 1 godzinę temu Autor Zgłoś Udostępnij Napisano 1 godzinę temu 1 godzinę temu, Filip454 napisał: Gdyby ktoś zbudował odpowiedni indeksator, to bez wątpienia istnieje możliwość zrobienia pełnego lustra. To tylko kwestia czasu, a czasu takiego właśnie braknie, bo jest tylko miesiąc. Próbuj tym programem podobno się da. Link do komentarza Udostępnij na innych stronach More sharing options...
Filip454 Napisano 1 godzinę temu Zgłoś Udostępnij Napisano 1 godzinę temu (edytowany) Ten program nie nadaje się do kopiowania dynamicznego forum. Ja wiem jak to zrobić, tylko po prostu fizycznie sam tego nie jestem w stanie zrobić, nawet 200 tematów w miesiąc. Musiałbym być sztuczną inteligencją z przyszłości Dlatego jak znasz jakieś tematy, które warto skopiować to wklejaj linki i wszyscy inni również. Żebyśmy wspólnie robili to trzeba inny model działania. Instrukcję mam na końcu języka, tylko chcę to najpierw posprawdzać, by każdemu było łatwo. Najlepiej jakby się tylko link wklejało i czekało Edytowano 59 minut temu przez Filip454 Link do komentarza Udostępnij na innych stronach More sharing options...
Tombycz Napisano 56 minut temu Autor Zgłoś Udostępnij Napisano 56 minut temu (edytowany) 7 minut temu, Filip454 napisał: Ten program nie nadaje się do kopiowania dynamicznego forum. Skopiowanie forum dynamicznego może być nieco skomplikowane, ponieważ dynamiczne strony często generują zawartość na żywo za pomocą JavaScript. Jednak istnieje kilka metod, które mogą pomóc: Narzędzia do kopiowania stron internetowych: Możesz użyć narzędzi takich jak HTTrack lub WebCopy, które pozwalają na kopiowanie całych stron internetowych, w tym dynamicznych forum. Skrypty Python: Możesz napisać skrypt w Python za pomocą bibliotek takich jak BeautifulSoup czy Scrapy, które pozwalają na wykrywanie i kopiowanie zawartości z dynamicznych stron. Narzędzia do web scraping: Istnieją narzędzia online, które umożliwiają kopiowanie zawartości z dynamicznych stron internetowych, takie jak Octoparse czy ParseHub. Edytowano 52 minuty temu przez Tombycz Link do komentarza Udostępnij na innych stronach More sharing options...
Ayane Napisano 50 minut temu Zgłoś Udostępnij Napisano 50 minut temu Scraping for nawet jeśli nie są dynamiczne wychodzi strasznie lipnie niestety. No i kwestia tego, ile to by czasu zajęło. Niedawno ściągałam forum które ma może z 500MB wszystkiego, to nie dość że szło pół dnia i całą noc, to nie pobrało całości, a to, co pobrało, to zapisało według własnego widzimisię. Skończyło się tak że i tak na gwałt wszyscy robiliśmy backupy na webarchive, a ważniejsze strony sobie do PDFa drukowaliśmy z widokiem 1000 postów na stronę Link do komentarza Udostępnij na innych stronach More sharing options...
Filip454 Napisano 45 minut temu Zgłoś Udostępnij Napisano 45 minut temu Ale na Web Archive też wszystkiego nie ma. To proste jest, tylko ja w jednej osobie zbackupuję maksymalnie kilkaset wątków w miesiąc Link do komentarza Udostępnij na innych stronach More sharing options...
Recommended Posts
Utwórz konto lub zaloguj się, aby skomentować
Musisz być użytkownikiem, aby dodać komentarz
Utwórz konto
Zarejestruj nowe konto na forum. To jest łatwe!
Zarejestruj nowe kontoZaloguj się
Masz już konto? Zaloguj się.
Zaloguj się