字符集 on Tony Bai

字符集 on Tony Baihttps://tonybai.com/tags/%E5%AD%97%E7%AC%A6%E9%9B%86/Recent content in 字符集 on Tony BaiHugozh-cn2004-2026 Tony Bai. 版权所有.Mon, 13 Oct 2025 00:00:00 +0800string 与 rune 的设计哲学：为什么Go 程序员很少为“乱码”烦恼？https://tonybai.com/2025/10/13/string-and-rune-in-go/Mon, 13 Oct 2025 00:00:00 +0800https://tonybai.com/2025/10/13/string-and-rune-in-go/本文永久链接 – https://tonybai.com/2025/10/13/string-and-rune-in-go 大家好，我是Tony Bai。 > “为什么我的字符又乱码了？！” 这是一个在软件开发历史上，曾让无数程序员彻夜难眠的哀嚎。处理文本，是编程中最基础的任务之一，但其背后关于编码 (Encoding) 和字符集 (Character Set) 的水，远比看起来要深。正如 Joe...图解中文字符编码-Go语言例解https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/Thu, 07 Nov 2019 00:00:00 +0800https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/今天几个同事在处理一个有关中文字符编码的问题，感觉他们对字符编码这件事依然理解不够透彻。这里用图文方式对中文字符编码做一个简要的解释，例子使用Go语言。我们知道每个英文字母和数字在计算机中都会对应一个字节，或者说用一个字节来表示，这就是最初的ASCII码。但是随着计算机在全球范围内的广泛使用，非英语国家也要在计算机使用自己的字符，于是出现了字符集“百花齐放”的情况，我国在早期也颁布了自己的中文字...关于Go，你可能不注意的7件事https://tonybai.com/2015/09/17/7-things-you-may-not-pay-attation-to-in-go/Thu, 17 Sep 2015 00:00:00 +0800https://tonybai.com/2015/09/17/7-things-you-may-not-pay-attation-to-in-go/Go以简洁著称，但简洁中不乏值得玩味的小细节。这些小细节不如goroutine、interface和channel那样"高大上"，"屌丝"得可能不经常被人注意到，但它们却对理解Go语言有着重要的作用。这里想挑出一些和大家一起通过详实的例子来逐一展开和理解。本文内容较为基础，适合初学者，高手可飘过:) **一、源文件字符集****和字符集编码** Go源码文件默认采用Unicode字符集，Unic...使用iconv做内码转换https://tonybai.com/2009/10/31/internal-code-transform-by-iconv/Sat, 31 Oct 2009 00:00:00 +0800https://tonybai.com/2009/10/31/internal-code-transform-by-iconv/前不久某南方省份的客户反馈说我们的产品对某些生僻字(如“赟”)的转码支持的不好，终端收到后无法显示这个字。经分析，发现类似“赟”这样的字在GB2312编码标准中并未收录，要想支持这样的生僻字的内码转换需要产品支持目前最新的中文编码标准GB18030。而我们的产品在诞生到现在就一直只支持GB2312，这就是导致这一问题的直接原因。产品以前的代码库中内码转换的接口都是自己实现的，仅支持GB2312...也谈VIM字符集编码设置https://tonybai.com/2009/09/28/also-talk-about-vim-charset-configuration/Mon, 28 Sep 2009 00:00:00 +0800https://tonybai.com/2009/09/28/also-talk-about-vim-charset-configuration/安装完中文语言包支持后，Ubuntu的默认locale是zh\_CN.UTF-8(即简体中文语言环境，字符集内码UTF-8)。这与我们日常开发环境中Unix设定的环境有所区别，我们日常使用的环境一般为zh\_CN.GBK或zh。我们的源代码文件的字符编码也都是GBK的编码，直接在Ubuntu下用默认设置的VIM打开后，中文的注释会显示乱码。如果你直接编辑这个文件并提交，那么其他在Unix下开发的同...