Собственный интернет архив
Публичный пост photo by Erik Mclean
BookMark'и сломаны и не работают, потому что через год или два ссылка будет сломана из-за обновления движка, из-за того, что сайт закрылся, пользователь решил удалить свои посты или интернет-газета теперь доступна только по ежемесячной подписке в 10 долларов.
Расскажите как вы храните знания, полученные в интернете, как формируете свой ReadItLater и в каком виде потом это используете.
Сам я перепробовал многое: и Pocket, и Instapaper, и EverNote, и Raindrop. Сейчас я пришёл к использованию Joplin: развернул свой сервер, использую его под разнообразные заметки, web-clipping и быструю/временную публикацию чего-нибудь.
Конечно же, как всегда, у OpenSource продуктов - сплошные блеск и нищета одновременно, но я для себя решил, что сохранность данных - это исключительно моя забота и доверия внешним сервисам никакого нет.
Как базу знаний (да еще и ежедневник) использую Obsidian с их облачной синхронизацией. Отличный редактор, куча плагинов и неплохое мобильное приложение. Есть расширение для хрома, которое собирает страницу в Markdown для импорта. Это не Web Clipper, конечно, но мне вроде хватает.
По поводу синхронизации здесь есть 2 варианта:
Выкачиваю страницы в свой notion с помощью плагина для хрома
инструкция от самого notion
https://www.notion.so/Web-Clipper-ba54b19ecaeb466b8070b9e683c5fce1
ссылки на плагины chrome, safari, firefox
https://www.notion.so/web-clipper
Если надо просто сохранить веб-страницу локально и потом больше никогда не открывать, то есть: https://archivebox.io/
Мне не совсем зашло, но Memex работает как нечто нужное: сохраняет все, что ты смотришь через браузер, локально с возможностью поиска и аннотации
Недавно узнал, что "грабить" сайты можно при помощи
wget
. Пример:Получается что-то такое:
Пользуюсь расширением для браузера https://github.com/gildas-lormeau/SingleFile - сохраняет страницу целиком и полностью в единственный html файл. Кладу их себе в папку и пока всё. Костыльно конечно.
Раньше использовал Scrapbox в файрфоксе - тоже можно было сохранять страницы с полной разметкой + был поиск по содержимому, можно было удалять ненужные части страницы через визуальный редактор, но после закручивания гаек для плагинов такого-же удобного пока не нашёл (есть последователь - WebScrapBook, но у него нет удобного интерфейса просмотра сохранённых данных).
Если делать совсем по хардкору, то есть такая технология как кеш сервера https://networkencyclopedia.com/cache-server/ , в основном используются для спутникового интернета - сохраняют всю информацию, проходящую в обслуживаемую подсеть, и если другой пользователь из этой подсети хочет получить ту же страничку, то подсовывается она из кеша, чем экономится интернет трафик и ускоряется отклик.
Получается если её поставить как pi-hole промежуточным звеном на выход в интернет, то туда можно добавлять флаг какой-то - о, а вот это сохрани, а всё остальное по истечении условных 10 дней будет зачищаться.
А у меня вопрос наверно ко всем комментирующим выше - а вот эти плагины и расширения, они же наверняка не идут по ссылкам (например приложен файл прошивки устройства в виде ссылки на гуглдиск) и встроенным видео например, а сохраняют информацию только ту что есть на самой странице - картинки и текст.
Таким образом получается всё равно нужно заморачиваться и прокликивать всё что нужно сохранить из страницы.
Zotero тоже может выгружать веб-страницы на комп
Записываю в Obsidian. Стремлюсь следовать принципам цеттелькастена - не копипастить, а писать своими словами. Это не относится к инструкциям и прочим рецептам - их просто копирую.
Написал небольшого бота в телеге. Ему можно скормить ссылку, указав категорию. Можно потом сказать "дай ссылку по такой-то категории". Развлекательное читаю в транспорте или когда устал. Вдумчивое обрабатываю каждый день понемногу.
pinboard.in, кстати, уже несколько лет как умеет за небольшие деньги сохранять копии страниц по твоему списку букмарков.
получается двойная польза - я и так этим сервисом пользуюсь для букмарков, а тут ещё и старые заметки сохраняются как раз на случай, если они внезапно исчезнут в оригинале.