Windows服务器MySQL中文乱码的解决方法

2019-01-05 10:01:26 来源：易采站长站作者：刘景俊

我没有深入学习过utf8、gbk编码的细节，极可能说的不准确，只知道简单的ASCII编码（-_-），但是可以了解个全局情况。从上面来看，latin1的单字节编码方式很有用，其他的编码可以转换为它再转回去而不至于丢失内容。所谓单字节编码就是挨着一个个来，我理解是，比如圣诞节到了，你要送妹子一箱苹果，为制造浪漫，商铺提供两种包装方式，一是按个数来，即单个苹果包装进一个盒子，来一个包装一个，这样，妹子在拆完所有的盒子后完完整整的可以还原为一个个完整的和一箱完好无损的苹果，二是按重量来，每个盒子限重2两、3两、6两，这样在包装时，若刚好重3两的当然可以完整的放进一个盒子，但是若不够或者多了，勉不了要切开苹果，或者再往盒子中添加其他的部分苹果，这样的话，妹子再无论怎样拆开盒子，都会得到一箱残缺不堪的苹果了，因为你在按照这种包装方式进行时，已经破坏了单个苹果的完整性，现在还原不回来了~我们的字符集编码转换就是在做这种重新包装的工作，latin1恰好就像单个苹果包装，而utf8就像第二种方式。

而刚才说的完全匹配的情况是，你去买一箱苹果，箱子里边的所有苹果重量已经恰好要么是2两，要么是3两或6两的，这样再按重量包装时当然就恰好分配了，得到的仍然是完整的苹果。

所以说白了，两种可行的方式是：

1. 所有变量均设置成latin1（set names latin1;），这样，即便我们所使用的编辑客户端编码多样（gbk或utf8），最终可以得到正确结果；

2. 所有的设置成gbk或者gb2312（国标编码，只用于简体中文），采用完全匹配；

3. 针对中间的转换过程，比如gbk输入，将character_set_client、character_set_connection视为latin1，character_set_database设为gb2312，建表时定字符集为gb2312，character_set_results也可以定为gb2312，当然这只是鸡肋，本质上还是用了latin1，gbk转latin1再转gb2312时只适用于简体。

最后，关于字符集校对规则，只了解一点。在我们设置mysql字符集时，mysql会自动给一个对应的校对规则，比如设置charset为utf8，默认的collation就是utf8_general_ci，gb2312字符集对应gb2312_chinese_ci，mysql命令查看所有校对规则是show collation，查看某一对应字符集的校对规就是show collation like 'utf8%'了。

字符集校对是一种对使用当前字符集时采用的排序、对比方式，即便同一种字符集，在不同的地区也是不同的对比方式，所以才有校对这么一说，比如utf8_general_ci，这个ci就是case insensitive，即大小写不敏感，采用它校对时，查询某字段值匹配时，大小写的记录都会出现，当然还有其他的规则，utf8打印出来一大坨，不细研究了~