Как вы сохраняете интернеты? 📁

 Публичный пост

Всем привет!

Я уже давно страдаю "синдромом Плюшкина" в современном варианте, то есть коллекционирую материалы, которые могут мне пригодиться. Большая часть этих материалов, это сайты или пдф-файлы. И если с пдфками проблем не возникает, то вот с получением сайтов проблемы весьма ощутимы.

Хочется получить автономную страницу сайта без ужасных мук ручного форматирования результата. Желательно в формате pdf для однородности.

Сейчас пользуюсь веб-скрапером OneNote, для простых случаев работает хорошо.

Ну и общий вопрос ко всем из клуба: Как сохраняете интернеты у себя?

Связанные посты
28 комментариев 👇
Roman Sytnyk , Mobile Software Engineer 16 февраля 2021

Как правило, сохранение интернетов – занятие неблагодарное.

Раньше в основном сохранял всё в специальные папочки в закладках браузера (синхронизируемых).
Какие-то потенциально полезные статьи, библиотеки для ЯП и т.п.
Но 95% этих сохранёнок я не открывал вообще за лет ~5.

Самое нужное сейчас просто раскидываю по папкам в Notion, такой себе личный справочник. И то стараюсь не засорять его.
Думаю твой вариант с OneNote – вполне годный.

  Развернуть 1 комментарий

Помимо стандартного совета нажать Ctrl+P, посоветую ещё писать короткую заметку в свою предпочитаемую базу знаний (Evernote, Notion, тысячи их, я пользуюсь Obsidian). Тут важно записать ключевую идею (или почему тебе понравилась статья) своими словами. Когда потом будешь смотреть на заметку, поблагодаришь себя из прошлого, потому что будет понятно, зачем ты вообще это читал.

  Развернуть 1 комментарий

@Anderei, стал недавно это все перерабатывать в базу знаний (тоже, кстати, Obsidian :) )
Но мне потом для вдумчивого чтения хочется иметь под рукой оригинал

  Развернуть 1 комментарий

@alesnim, отлично!
Мне обычно хватает ссылки на оригинал, сохраняю оффлайн pdf, только если это какой-нибудь платный ресурс (или требуется авторизованный вход, а читать буду с другого компьютера).

  Развернуть 1 комментарий

Хочется получить автономную страницу сайта без ужасных мук ручного форматирования результата. Желательно в формате pdf для однородности.

У меня была примерно такая же проблема и я сделал себе телеграм-бота (писал о нём в Клубе). Если кратко: кидаешь ему ссылку на статью — он присылает читабельный пдф (как ридер-мод в браузерах).

Я его использую в связке с Syncthing, потому что чаще со смартфона статьи читаю. Захотел сохранить статью, кидаю боту ссылку, он создаёт пдф, я сохраняю файл в загрузки (прямо в телеграме есть Save to downloads). Дальше Syncthing подхватывает новый пдф-файл и синхронизирует его с моим компом (в Syncthing задано правило, чтобы он из загрузок только пдфки синхронизировал и не удалял с компа, если удаляю на смартфоне).

  Развернуть 1 комментарий

Если macos - devonthink, сохраняет и в pdf с возможностью последующего поиска, и WebArchive (автономная копия страницы с оригинальной разметкой и оформлением). Для кроссплатформы есть браузерное расширение SingleFileZ

  Развернуть 1 комментарий

@Bi9qiIifNGtYhshh, попробовал SingleFileZ о-очень хорошо, большое спасибо за рекомендацию

  Развернуть 1 комментарий
Павел Паничев , Разработчик Бекендов 12 мая в 17:05

Врываюсь с некропостом!

Раньше сохранял всё подряд в SingleFile.
Сохраняет любую страницу со всеми ресурсами в один html-файл.
В отличие от его форка SingleFileZ, который упоминался выше, для открытия сохраненных страниц не нужно ставить расширение, они просто открываются в любом браузере.

Потом узнал про MarkDownload.
Он довольно качественно сохраняет почти любой пост из интернетов формата текст+картинки в Markdown.
По желанию картинки можно выкачивать и класть рядом, а можно оставлять в виде ссылок на оригинальные ресурсы.
Теперь всё, что можно, сохраняю через него и кладу в Obsidian.

SingleFile всё ещё использую для нетривиальных страниц, с которыми MarkDownload не справляется.

  Развернуть 1 комментарий

Мм.. Не знаю подойдет ли, но если ты хочешь получить страницу в PDF, то я бы порекомендовал воспользоваться незатейлевой функцией Cntrl+P. Современные браузеры позволяют отправлять страницы на печать на "виртуальные принтеры".

Как по мне, лучше будет разобраться с тем, что ты будешь делать с таким большим количеством PDF'ок. Но тут уже каждому свое.

Если вопрос в продуктивности, то я стараюсь читать уже сохраненные статьи, сохраняю же их после беглого прочтения. В свою очередь практика показывает, что половина из страниц в принципе не торт, вторая с содержанием, которое тебе не шибко то и подходит, но алгоритм один:

  1. Увидел статью (Спасибо RSS и FeedBro)
  2. Бегло прочел
  3. Если понравилось, то cкопипастил статью в соответствующую папку в Notion
  4. Выделил время на прочтение статьи
  5. Прочел (или удалил)

Таким образом я записи клуба читаю, хабр, например

  Развернуть 1 комментарий

@dvragulin, я поступаю так же, прогоняю все источники через Feedly. Но я сохраняю как раз для того что бы потом точно иметь доступ к материалу, а то часто бывает так, что вот была ссылка, а переходишь и все, материал удален.

За алгоритм спасибо, сам пользуюсь похожим.
Вот как раз для первого этапа мне и надо и накопить материал (что бы потом быть уверенным, что он останется доступным для прочтения).

P.S. Функция печати в браузерах работает только на простых страничках и теряет внешний вид, а хочется не только чтобы функционально, но и красиво)

  Развернуть 1 комментарий

Для ресурсов которые умирают (например гта.аг.ру, я там когда-то уйму времени провел), я сделал полные скриншоты страниц и положил в дропбокс.
Для статей - просто печатаю в pdf и складываю в свою библиотеку на базе Calibre-Web.

  Развернуть 1 комментарий

Evernote ведь придумали как раз для этого! (а точнее их Web Clipper)

  Развернуть 1 комментарий

Одно время очень плотно использовал https://www.wallabag.it за то, что умеет как pocket сохранять страницы к себе в кеш и клиент на телефоне (android) умеет (так-же как pocket) читать их вслух, но в полном оффлайне. На деле оказалось, что обновлять его с v1 на v2 неблагодарно, а поддержка мобильного клиента очень сильно ограничена определёнными версиями (например сервера v1 несмотря на то, что работали отлично - уже не поддерживаются клиентом). Продукт определённо хорош и вдвойне хорош тем, что умеет selfhost + offline.
Сейчас в основном пользуюсь https://joplinapp.org/ + plugins + web-clip (который относительно неплохо умеет html2md) чтобы немного причесать статью, проставить теги и проч. В целом удобное решение для Desktop+Mobile, умеет много способов синхронизации втч webdav/облако/папочку таскать.
Во все глаза уже смотрю и осторожно трогаю obsidian, но отсутствие приемлимой мобильной синхронизации последнего портит все хорошие впечатления

  Развернуть 1 комментарий

@sta, а какие плагины для Joplin используешь?

  Развернуть 1 комментарий

@AlexRiabtsev, А я как-то залип их устанавливая... OCR на удивление неплохо работает, inline tag, slashCommand, turnToChart - если почитать документацию - то можно добиться неплохих результатов на небольших таблицах. В целом они про "красивое" и их полезность на второй взгляд не так, чтобы делит жизнь на "до" и "после". Базовый функционал приложения всё ещё растёт.
Другое дело - Math Mode, это я давно искал и пользуюсь. Даже жаль, что на телефоне не работает.

  Развернуть 1 комментарий

Раньше сохранял страницы целиком. Потом понял, что так не работает, и страницы лежат мертвым грузом. Стал выписывать идеи по методу цеттелькастена в обсидиан. Пока нравится.

  Развернуть 1 комментарий

Я в Notion кидаю через клиппер в специальную таблицу. Их там удобно сортировать, писать свой коммент, добавлять теги, фильтры и тд, получается точная копия + ссылка на оригинал. Пока ничего удобнее не нашёл. Ещё и бесплатно.

  Развернуть 1 комментарий

Раньше часто использовала Pocket (расширение для браузера + приложение для телефона) для сохранения статей на почитать позже. Можно заранее прогрузить статью дома на вайфае и в дороге читать в оффлайн. В приложении шрифт больше и удобней, чем читать с телефона в вебе, но можно открыть статью в исходнике. Добавить в коллекцию (архив), короче удобно.
Сейчас, правда, все реже действую по паттерну "сохранить, чтобы почитать когда-то потом". Конспекты в Notion использую активнее, но скорее пишу, чтобы разбираться по методу Фейнмана, упрощаю и стираю. Стремлюсь важное держать в голове. Хочется больше знать, нежели знать где искать) Но это путь))

  Развернуть 1 комментарий

ScrapBook был лучшим расширением бразера для этого, который сохранял в нормальном виде на установленую глубину, но он пачил в бозе.

Единственное, что могу посоветовать - это порыться на https://alternativeto.net/software/scrapbook/

  Развернуть 1 комментарий
Anna , Программист 16 февраля 2021

Есть ресурсы для сохранения страниц. Уже не знаю какие сейчас живы из них, я давно ими не пользуюсь. Но есть selfhosted Archivebox, например. С самих страниц я обычно просто ключевые тезисы себе собираю, если вдруг в будущем понадобится. Архивацией слишком лениво заморачиваться. Особенно с учетом того, что архивированные страницы мне нужны так редко.

  Развернуть 1 комментарий

@Doredel, За Arhivebox спасибо

  Развернуть 1 комментарий
Yury Katkov , миддл формошлёп 16 февраля 2021

Самые лучшие курсы на курсере я копирую в видосики ВКонтакте, потому что говнюки позволяют себе закрывать к ним доступ.

  Развернуть 1 комментарий

😱 Комментарий удален его автором...

  Развернуть 1 комментарий

Сервисы типа getpocket.com или raindrop.io в премиум версии сохраняют копии страниц которые добавил в закладки.
Т.е даже если сайт будет недоступен то все равно можно будет прочитать страницу.

  Развернуть 1 комментарий

😱 Комментарий удален его автором...

  Развернуть 1 комментарий

Для сохранения контента всей страницы изредка использую расширение для хрома GoFullPage. Но это наверное как твой One Note.

  Развернуть 1 комментарий

@aponomarev, Да, аналогично по функционалу

  Развернуть 1 комментарий

Мой личный опыт: лучшего клиппера, чем у Эверноут, на рынке пока нет. Ноушен абсолютно проклят в плане функционала (нет сохранения выбранной области, ридер мод и проч.) и в плане багов (просто рандомно теряет картинки регулярно, например). Кроме того, в Эверноут удобная структура «набор блокнотов → блокнот → заметка» и глобальное дерево тегов (которое в Ноушене прикручивается только через жуткие костыли). OneNote вообще какой-то дикий зверь, логику построения базы данных в нем я так и не понял.

При этом Эверноут в целом очевидно устарел, писать в нем заметки, не связанные с поддержанием базы знаний, некомфортно, таск-менеджер убогий. А Ноушен слишком уж программерский) В результате страдаю, пишу заметки в Эпл Ноутс, ссылки копирую в Эверноут и жду, когда кто-нибудь перевернет стол наконец.

  Развернуть 1 комментарий

Всем привет ))
по запросу в гугл попал на эту страницу и мне есть что сказать:
буквально сегодня посоветовали приложение hints.so
По хоткеям умеет сохранять текст и скриншоты в себя. Есть мобильная и десктопная версии.

Это, конечно, не полная копия страницы, но врядли нужна реклама и какие-то менюшки для сохранения.

  Развернуть 1 комментарий

наверное не самый популярный способ, но мне зашло скидывать все в Obsidian.

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб