Как вы сохраняете интернеты? 📁  Публичный пост

Всем привет!

Я уже давно страдаю "синдромом Плюшкина" в современном варианте, то есть коллекционирую материалы, которые могут мне пригодиться. Большая часть этих материалов, это сайты или пдф-файлы. И если с пдфками проблем не возникает, то вот с получением сайтов проблемы весьма ощутимы.

Хочется получить автономную страницу сайта без ужасных мук ручного форматирования результата. Желательно в формате pdf для однородности.

Сейчас пользуюсь веб-скрапером OneNote, для простых случаев работает хорошо.

Ну и общий вопрос ко всем из клуба: Как сохраняете интернеты у себя?

15 комментариев 👇

Помимо стандартного совета нажать Ctrl+P, посоветую ещё писать короткую заметку в свою предпочитаемую базу знаний (Evernote, Notion, тысячи их, я пользуюсь Obsidian). Тут важно записать ключевую идею (или почему тебе понравилась статья) своими словами. Когда потом будешь смотреть на заметку, поблагодаришь себя из прошлого, потому что будет понятно, зачем ты вообще это читал.

  Развернуть 1 комментарий

@Anderei, стал недавно это все перерабатывать в базу знаний (тоже, кстати, Obsidian :) )
Но мне потом для вдумчивого чтения хочется иметь под рукой оригинал

  Развернуть 1 комментарий

@alesnim, отлично!
Мне обычно хватает ссылки на оригинал, сохраняю оффлайн pdf, только если это какой-нибудь платный ресурс (или требуется авторизованный вход, а читать буду с другого компьютера).

  Развернуть 1 комментарий

Как правило, сохранение интернетов – занятие неблагодарное.

Раньше в основном сохранял всё в специальные папочки в закладках браузера (синхронизируемых).
Какие-то потенциально полезные статьи, библиотеки для ЯП и т.п.
Но 95% этих сохранёнок я не открывал вообще за лет ~5.

Самое нужное сейчас просто раскидываю по папкам в Notion, такой себе личный справочник. И то стараюсь не засорять его.
Думаю твой вариант с OneNote – вполне годный.

  Развернуть 1 комментарий

Хочется получить автономную страницу сайта без ужасных мук ручного форматирования результата. Желательно в формате pdf для однородности.

У меня была примерно такая же проблема и я сделал себе телеграм-бота (писал о нём в Клубе). Если кратко: кидаешь ему ссылку на статью — он присылает читабельный пдф (как ридер-мод в браузерах).

Я его использую в связке с Syncthing, потому что чаще со смартфона статьи читаю. Захотел сохранить статью, кидаю боту ссылку, он создаёт пдф, я сохраняю файл в загрузки (прямо в телеграме есть Save to downloads). Дальше Syncthing подхватывает новый пдф-файл и синхронизирует его с моим компом (в Syncthing задано правило, чтобы он из загрузок только пдфки синхронизировал и не удалял с компа, если удаляю на смартфоне).

  Развернуть 1 комментарий

Если macos - devonthink, сохраняет и в pdf с возможностью последующего поиска, и WebArchive (автономная копия страницы с оригинальной разметкой и оформлением). Для кроссплатформы есть браузерное расширение SingleFileZ

  Развернуть 1 комментарий

@Dementiy, попробовал SingleFileZ о-очень хорошо, большое спасибо за рекомендацию

  Развернуть 1 комментарий

Мм.. Не знаю подойдет ли, но если ты хочешь получить страницу в PDF, то я бы порекомендовал воспользоваться незатейлевой функцией Cntrl+P. Современные браузеры позволяют отправлять страницы на печать на "виртуальные принтеры".

Как по мне, лучше будет разобраться с тем, что ты будешь делать с таким большим количеством PDF'ок. Но тут уже каждому свое.

Если вопрос в продуктивности, то я стараюсь читать уже сохраненные статьи, сохраняю же их после беглого прочтения. В свою очередь практика показывает, что половина из страниц в принципе не торт, вторая с содержанием, которое тебе не шибко то и подходит, но алгоритм один:

  1. Увидел статью (Спасибо RSS и FeedBro)
  2. Бегло прочел
  3. Если понравилось, то cкопипастил статью в соответствующую папку в Notion
  4. Выделил время на прочтение статьи
  5. Прочел (или удалил)

Таким образом я записи клуба читаю, хабр, например

  Развернуть 1 комментарий

@dvragulin, я поступаю так же, прогоняю все источники через Feedly. Но я сохраняю как раз для того что бы потом точно иметь доступ к материалу, а то часто бывает так, что вот была ссылка, а переходишь и все, материал удален.

За алгоритм спасибо, сам пользуюсь похожим.
Вот как раз для первого этапа мне и надо и накопить материал (что бы потом быть уверенным, что он останется доступным для прочтения).

P.S. Функция печати в браузерах работает только на простых страничках и теряет внешний вид, а хочется не только чтобы функционально, но и красиво)

  Развернуть 1 комментарий

Для ресурсов которые умирают (например гта.аг.ру, я там когда-то уйму времени провел), я сделал полные скриншоты страниц и положил в дропбокс.
Для статей - просто печатаю в pdf и складываю в свою библиотеку на базе Calibre-Web.

  Развернуть 1 комментарий

Evernote ведь придумали как раз для этого! (а точнее их Web Clipper)

  Развернуть 1 комментарий
Anna, Программист 16 февраля в 18:58

Есть ресурсы для сохранения страниц. Уже не знаю какие сейчас живы из них, я давно ими не пользуюсь. Но есть selfhosted Archivebox, например. С самих страниц я обычно просто ключевые тезисы себе собираю, если вдруг в будущем понадобится. Архивацией слишком лениво заморачиваться. Особенно с учетом того, что архивированные страницы мне нужны так редко.

  Развернуть 1 комментарий

@Doredel, За Arhivebox спасибо

  Развернуть 1 комментарий
Yury Katkov, миддл формошлёп 16 февраля в 23:51

Самые лучшие курсы на курсере я копирую в видосики ВКонтакте, потому что говнюки позволяют себе закрывать к ним доступ.

  Развернуть 1 комментарий

😱 Комментарий удален его автором...

  Развернуть 1 комментарий

Сервисы типа getpocket.com или raindrop.io в премиум версии сохраняют копии страниц которые добавил в закладки.
Т.е даже если сайт будет недоступен то все равно можно будет прочитать страницу.

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб