错误 1366:将字符串插入 MariaDB 时字符串值不正确
来源:stackoverflow
时间:2024-03-17 19:00:30 189浏览 收藏
当将长度超过 10 个字符的字符串插入 MariaDB 表时,使用 `[:10]` 子切片可能会损坏数据,因为索引字符串按字节操作。正确的方法是根据排序规则(例如 utf8mb3)计数字符,并使用 `[]rune` 切片来正确剪切字符串,避免破坏 UTF-8 编码。
我的 mariadb 表具有索引 varchar(10) not null collate 'utf8mb3_general_ci' 类型。我在 go 中有一个字符串,如果它更长,我将其削减为 10 个字符,以插入/更新此表。我把字符串剪成:
if len(value) > 10 {
value = value[:10]
}
现在我遇到了以 š 字符结尾的字符串问题。 mariadb 抛出错误:error 1366:字符串值不正确:'\\xc5'。查找unicode表,这个字符表示为\xc5\xa1,这让我相信字符串的切割在某种程度上使数据库无法消化该字符串?
我想避免在代码中处理 utf8/unicode,因为这需要遍历所有数据库方法并处理所有字符串。我不认为这是必要的,因为我以前从未需要过它。所以我认为问题出在其他地方,但不确定在哪里。
我尝试将排序规则切换为 utf8mb4_general_ci 但这也没有帮助。
有趣的是,如果我直接使用 heidisql 编辑列,字符串保存得很好。这让我相信这可能是驱动程序问题。我一如既往地使用 github.com/go-sql-driver/mysql。所以我预计不会出现问题,但是谁知道呢...
正确答案
这让我相信字符串的切割在某种程度上会使数据库无法消化该字符串?
如果您的程序有机会处理多字节字符,则通过子切片为 value[:10] 来切割字符串(并使用 len 测量长度)始终是一个错误。这是因为索引字符串对其字节进行操作,这可能是也可能不是多字节编码的一部分。
正如您所发现的,字符 š 在 utf-8 中编码为 \xc5\xa1。如果这两个字节出现在 value 字符串中的索引 9 和 10 处,则索引表达式 [:10] 会损坏数据。
字符集 utf8mb3 和 utf8mb4 仅将允许的 utf-8 范围分别限制为 3 字节和 4 字节字符,但 \xc5 本来就不是有效的 utf-8,因此无论哪种方式都会被拒绝。
在 mariadb 中,数据类型为 varchar(n) 的列对字符进行计数(由排序规则指定)。您想要在第十个字符处而不是第十个字节处剪切 value 字符串。
我想避免在我的代码中处理 utf8/unicode
您已经通过将 mariadb 排序规则声明为 utf8mb3 来承认 utf-8。将代码中的输入数据正确处理为 utf-8 是合乎逻辑的。要剪切第 n 个字符(或 rune,在 go 中表示 unicode 代码点),您可以使用类似以下内容:
// count the runes
if utf8.RuneCountInString(value) > 10 {
// convert string to rune slice
chars := []rune(value)
// index the rune slice and convert back to string
value = string(chars[:10])
}
这不会破坏 utf-8 编码,但是请记住,它会进行更多分配,并且不会考虑组合字符,例如当涉及连接器 200d 时。
好了,本文到此结束,带大家了解了《错误 1366:将字符串插入 MariaDB 时字符串值不正确》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!
-
502 收藏
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
139 收藏
-
204 收藏
-
325 收藏
-
478 收藏
-
486 收藏
-
439 收藏
-
357 收藏
-
352 收藏
-
101 收藏
-
440 收藏
-
212 收藏
-
143 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习