悠闲数学娱乐论坛(第2版)'s Archiver

kuing 发表于 2016-7-22 17:40

将书中的 url 链接导出为 html

闲得慌就是容易产生一些无聊的想法——刚才突然想到,能不能将《撸题集》中的众多 url 链接集中起来?

开始时想在 PDF 阅读器里入手,但在 Adobe Acrobat 里鼓捣了好一会都没成功,顶多把全部 http 搜出来,也不知怎么一次过全部复制。

想来想去,还是从源代码入手吧,既然 tex 能生成 aux、toc 这些辅助文件,那要实现我想要的东西应该没什么问题吧。

看了下 texbook 里关于读写的相关内容,果然很容易就解决了:
在正文开始前加上[code]\newwrite\urlfile
\immediate\openout\urlfile=urls.html\relax
\let\oldurl\url
\renewcommand\url[1]{%
\immediate\write\urlfile{<p><a href="#1" target="_blank">#1</a></p>}%
\oldurl{#1}}[/code]在结尾处加[code]\immediate\closeout\urlfile[/code](其实不加这个关闭好像也行,不过不知会不会有什么不良后果)
这样,编译之后就会生成一个包含书中全部 url 链接的 html 文件,打开还能点击的。

刚才测试生成的文件:[attach]4392[/attach],1663 行,也就是书中共 1663 个 url 链接。

真无聊……

kuing 发表于 2016-7-22 18:04

接下来就可以用网页存档工具把那些网页批量保存到本地,我是存档党……

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.