由于某种原因,上周末开始学习使用TeX进行文档排版。哦,当然不是直接使用Donald Knuth他老人家设计的最原始的TeX命令。经过这么多年的发展,TeX领域早已出现了各种各样基于TeX开发的层次更高、易用性更好、更加让作者关注内容的好工具。在Ubuntu下,我选择了"TeX Live"。

周末的时间比较零碎(有了果果后,除了晚上外白天很难拿出一长段的时间钻研些东西了),TeX Live安装和体验的过程也是一波三折。TeX Live支持多种安装方式,起初我选择了网络安装,但TeX Live的网络安装程序需要下载2000多个小文件,我的1M宽带实在是太慢,遂放弃。替代的是下载TeX Live的iso文件,这个iso居然有1.9G,着实让我吃惊不小。虽然只有一个.iso文件,但下载过程耗时估计与网络安装也没差多少。不知等待了多久,TeX Live 2010 iso终于下载完毕。安装步骤参考了网上的一些资料,大致是:
1、安装perl-tk,TeX Live的图形化安装需要这个包的支持
sudo apt-get install perl-tk
2、挂载iso,执行安装程序
sudo mount -o loop texlive2010.iso /cdrom
sudo /cdrom/install-tl -gui

Tex Live包确很庞大,完全安装后要2.5个多G空间,无奈本子磁盘太小,需要对其做些裁减,在安装窗口中,点击"Language Collections"按钮,在打开的对话框中取消除中文和英文以外的所有语言包,另外相关文档也只要中英文的,其他语种的一概取消安装。这样才能节省几百M的空间。TeX Live的默认安装目录是"/usr/local/texlive",我的根目录所剩可用空间已经不多了,不想将TeX Live安装到默认目录下,遂找了另外一个FAT32分区,建了一个texlive目录,修改了Tex Live的安装路径,点击“安装”。让人失望的是这次安装失败了,安装日志提示在操作某目标文件似乎没有某种权限,很是疑惑,命令前面已经sudo了,问题无法解决。将安装目录改回默认目录,再次尝试安装,这次倒是很顺利,安装后我的根目录下只剩下3G的空间了:(。

哦,似乎还忘记了一点:
在安装前务必将"创建指向系统目录的符号链接"这个选项置为"是/Yes",这样安装程序会自动为你设置好各种TeX
Live的环境变量,省去之后的很多麻烦。

3、测试安装结果是否正确
TeX Live的官方指南(通过texdoc
texlive-zh-cn打开)中给出了测试安装是否成功的步骤,这里就不赘述了。测试通过后,你将得到一份用Tex排版后的文档:sample2e.pdf,你可以同时打开sample2e.tex文件与sample2e.pdf做一下直观对比,了解一下各种语法宏的作用。

如果你只是做纯英文文档的排版,那你大可到此为止,无须继续向下看了,因为后面要说的是如何让TeX Live支持中文。

TeX Live支持中文排版的方式有多种,初学起来很容易被一堆概念和工具包名搞得晕头转向(直到目前,我也只是了解些皮毛)。这里固定选择一种方式:使用xelatex命令+xeCJK宏包组合。xelatex命令用来编译用LaTeX格式写成的tex文件,并支持Unicode编码以及直接访问系统字体。TeX Live 2010包中包含xelatex和xeCJK宏包,这样无须我们单独下载安装了。

开始测试TeX的中文支持,下面是一个包含中文字符的tex源文件:
%HelloTeX.tex
\documentclass{article}
\usepackage{xeCJK}
\setmainfont{SimSun}
\begin{document}
你好,TeX!
\end{document}

使用xelatex命令编译该tex文件 – xelatex HelloTeX.tex,执行结果如下:
……
Output written on HelloTeX.pdf (1 page).
Transcript written on HelloTeX.log.

xelatex将tex直接转换为pdf格式输出,并将转换过程的log输出到HelloTeX.log中了。用文档查看器打开HelloTeX.pdf,发现中文字符显示为乱码,看来这次转换并未成功。打开HelloTeX.log尝试分析一下转换日志,发现有这样的错误信息:
Invalid UTF-8 byte or sequence at line 5 replaced by U+FFFD.
Invalid UTF-8 byte or sequence at line 5 replaced by U+FFFD.
Missing character: There is no ? in font SimSun/ICU!
Missing character: There is no ? in font SimSun/ICU!

xelatex居然在HelloTeX.tex中发现了非法UTF-8字节!突然恍然大悟,我的VIM配置文件中将文件内码设置为GBK了,这样HelloTeX.tex的数据存储内码是GBK,而不是UTF-8,而xelatex似乎默认采用UTF-8分析.tex文件,不出错误才怪。

临时修改.vimrc,重新编辑HelloTeX.tex(或用iconv将HelloTeX.tex从GBK编码转换为UTF-8编码),重新执行xelatex HelloTeX.tex,这回成功了,"你好,TeX!"被正确输出到pdf文件中了。

xelatex应该也支持解析GBK内码文件才对,翻了翻网上资料,果不其然,通过增加一行\XeTeXinputencoding
"GBK"即可告知xelatex这个tex文件用的是GBK编码:
%HelloTeX.tex
\documentclass{article}
\usepackage{xeCJK}
\XeTeXinputencoding "GBK"
\setmainfont{SimSun}
\begin{document}
你好,TeX!
\end{document}

在体验TeX Live期间还遇到了xelatex找不到系统字体(如SimSun)的情况,后发现我的系统的确没有安装这些字体,Ubuntu 10.04安装字体似乎很方便,将simsun.ttc从Windows系统的"系统盘\Windows\Fonts"目录中copy出一份放置到你的~/.fonts下面即可,然后你通过"fc-list :lang=zh-cn"命令查看系统已安装的字体列表,字体Copy前列表中没有SimSun,Copy结束后我们就发现SimSun的踪影了:"宋体,SimSun:style=Regular"。

想用好TeX Live,不看Manual是不行的,如果你和我一样采用xelatex和xeCJK的组合,那么XeTex(texdoc xetex)和xeCJK(texdoc xeCJK)的Manual是必许要通读的。

© 2010, bigwhite. 版权所有.

Related posts:

  1. Review Board安装和配置札记
  2. Ubuntu一周体验
  3. 牢骚中体验Ubuntu
  4. Hello,autoconf和automake
  5. 为Ubuntu下的Firefox提速