vmario na jabber.gda.pl

Wirtualne chomikowanie

21 listopada 2009 @ 15:19:15. Poziom 0. Kategorie: Myśli spisane.

Niedawno Karol Zalewski pisał o problemach z długoterminowym archiwizowaniem danych: starzejącymi się nośnikami i brakiem wsparcia dla starych formatów dokumentów czy systemów plików. Od strony technologicznej jest to dosyć ciekawe i bardziej, niż by się to mogło na pierwszy rzut oka wydawać, złożone zagadnienie, ale myślę, że w przypadku archiwów publicznych, przy odpowiednim nakładzie kosztów, można by zrealizować jakiś system o trwałości rzędu stu lat. Później można przecież dokonać konwersji na kolejny okres czasu i tak aż do upadku cywilizacji.

Może trochę upraszczam, ale to dlatego, że dziś bardziej interesuje mnie to, czy problem dotyczy moich własnych materiałów. Od czasu założenia mojej pierwszej strony internetowej z roku na rok produkuję coraz więcej treści. Wciąż nie dorobiłem się jeszcze systemu archiwizacji z prawdziwego zdarzenia i tylko bieżące projekty otoczone są jakąś konkretną troską, a nad ich bezpieczeństwem czuwa Mercurial na zewnętrznym serwerze lub Dropbox. Reszta jest archiwizowana raz do roku (albo i rzadziej) na DVD, co trudno nazwać profesjonalnym rozwiązaniem.

Nie w tym jednak rzecz, jak archiwizować, ale co w ogóle temu procesowi poddawać. Weźmy dla przykładu chociażby moją kolekcję zdjęć. Jest tego już chyba z kilka gigabajtów, chociaż jako tako wartościowe fotografie stanowią pewnie około 80% wszystkich. Reszta albo jeszcze nie przeszła selekcji albo została pozostawiona, bo a nuż przyda się jako tło do jakiegoś projektu graficznego.

Z kolei z tych 80% tylko jakaś część to zdjęcia, których straty naprawdę bym żałował. Na szczęście większość z nich jest na Flickrze. Ważnych zdjęć osobistych i rodzinnych (które z oczywistych powodów nie lądują na Flickrze) nie mam wiele. Zaglądam zresztą do nich rzadko i nie widzę powodów do archiwizowania dziesiątek zdjęć z pojedynczego wydarzenia. Kiedy miałbym mieć czas to przeglądać? Na emeryturze? Na emeryturze to będę zaległości czytelnicze nadrabiał lub podróżował, jeżeli starczy sił i pieniędzy… A tak bardziej serio — miło jest od czasu do czasu rzucić okiem na zdjęcie, które przywoła wspomnienie ciekawego wydarzenia, a tym bardziej osoby, z którą było czy wciąż jest się blisko związanym, ale do tego wystarczą pojedyncze ujęcia, które muszą przetrwać góra siedemdziesiąt lat. Jeżeli kilkadziesiąt z nich przeżyje dłużej, to mogą być niezłą frajdą dla wnuków (sam uwielbiam stare fotografie), ale przecież i one wyprodukują własne zdjęcia i po naszych płakać nie będą.

Wpisy na tym blogu też nie są często przeze mnie przeglądane, ostatnio nawet zauważyłem, że niektóre z nich z trudem rozpoznaję jako swoje. Jeszcze gorzej jest z postami na techblogu, bo wiele z nich błyskawicznie się dezaktualizuje. Zresztą już jakiś czas temu znacznie ograniczyłem gromadzenie linków do wszelkiego rodzaju opisów, tutoriali i how to, bo lepiej jest na bieżąco korzystać z Google niż wyszukiwać w archiwum artykuły, które po roku zaczynają już trącić myszką.

Problem archiwizacji zaczyna mnie nurtować nie ze względu na same koszty i problemy technologiczne, ale z powodu faktu, iż za kilkanaście lat odnalezienie czegoś wartościowego w takim archiwum będzie bardzo trudne ze względu na jego olbrzymi rozmiar. A informacja, której nie można znaleźć, jest tak samo użyteczna jak ta, której w ogóle nie posiadamy. Więc po co przepłacać?

Automatyczne usuwanie zbędnej treści zmniejszyłoby problem z miejscem na archiwa, ale jest nierealne, bo jak napisać algorytm, który określałby sentyment do fotografii? Pozostaje ręczna analiza zasobów co jakiś czas albo staranna kategoryzacja (raczej też ręczna). Algorytmy jakiegoś indeksowania czy analizy metadanych też mogą pomóc i mimo niedoskonałości mają przynajmniej tę zaletę, że umożliwiają przeniesienie pracy z użytkownika na komputer, a przy dzisiejszych cenach za gigabajt pamięci możemy przymknąć oko na rozmiary archiwów.

Moje chore zamiłowanie do technologicznej elegancji każe jednak dbać o to, by rzeczy były tak proste, jak to tylko możliwe (ale nie prostsze!), i z tego względu wolałbym nie mieć za piętnaście lat archiwum o rozmiarze 10TB. Zresztą przy ostatniej przeprowadce i eliminowaniu starych gratów z mojej przestrzeni fizycznej, gdy wyniosłem na śmietnik ładnych kilka toreb najdziwniejszych staroci, pomyślałem, że jest coś przyjemnego w świadomości, iż pozbyło się zbędnego balastu.

Walczą zatem we mnie chomik i minimalista, a sposób archiwizacji, który mógłby zadowolić ich obu, wciąż nie został przeze mnie odkryty.

Komentarze

Dodaj komentarz

Wysyłając komentarz, wyrażasz zgodę na jego publikację na zasadach licencji CC BY-SA 3.0 PL. Autor zastrzega sobie prawo do moderacji komentarzy, szczególnie w przypadku wypowiedzi wulgarnych i niezwiązanych z tematem dyskusji.

(W komentarzach działa Markdown bez obrazków. HTML jest wyłączony.)

Aby dodać komentarz, wpisz kod z obrazka:

Creative Commons License 2007–2010 Mariusz Chilmon, Augustów — Gdańsk

Teksty, zdjęcia i inne zasoby mojego autorstwa na tej stronie są objęte licencją Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0 Polska, o ile nie zaznaczono inaczej.

Szablon powstał przy użyciu Wolnego Oprogramowania.

Wykorzystano zestaw ikon bwpx.icns autorstwa Paula Armstronga.

Całość napędza JoggerPL.