登录
首页 >  数据库 >  MySQL

分享我实现行政区划层级的思路方法!

来源:SegmentFault

时间:2023-02-16 15:36:10 152浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《分享我实现行政区划层级的思路方法!》,聊聊MySQL,我们一起来看看吧!

省-市-区这种三级地址的结构,是我们中国人写软件经常遇到的需求。(当然,往上可能有国家/地区,往下可能有乡镇/街道,层级数量是不一定的)

这个需求一般要满足几个特点:

  • 必须表现省市区的隶属关系。——不用说。铁则。

  • 存储要够省。——如果每条记录里都存所有的省市区,那可太笨拙了。其实如果存储省下了,好查询,也好维护。

  • 必须有快速的回溯。——找出包含小行政区的所有上级,是最频繁的查询需求。

  • 对付其他的查询方法,也要够灵活。

  • 一般使用中看作是死的,但不能写死,因为行政区划总有更新的一天。
    必须保证系统最低限度的灵活性。

左右值无限层级存储方法

我喜欢用左右值法来组织省-市-区的表格。

数据结构

-------------------------------------
name    lbb   ubb   depth  注:ID省略
-------------------------------------
吉林省   1     14    1
长春市   2     7     2
朝阳区   3     4     3
南关区   5     6     3
辽源市   8     13    2
龙山区   9     10    3
东丰县   11    12    3
辽宁省   15    18    1
沈阳市   16    17    2
-------------------------------------

数据表就像这样。这个组织方法的特点是:

  • 每一个区划覆盖一个整数值区间

  • 各个区间只嵌套不交叉。

  • 甚至各区间的上下限不允许重叠,左右值是无重复的。
    这是一个相当重要的优化。下边的查询,没有这个条件基本都不能成立或不太方便。

  • 最小的区间长度至少为1。

  • 总体是一个无限嵌套的结构。

以上边这个表格为例,他表示了这样一个分层结构:

1------------------吉林-------------------14 15---辽宁---18
 2------长春------7 8--------辽源--------13    16-沈阳-17
  3-朝阳-4 5-南关-6   9-龙山-10 11-东丰-12

这样,省-市-区就只需要存储一个数字,即该区划的左值,就可以了。

但必须注意:虽然存左值完全够实用了,但为了数据安全,必须另开设一个字段存储对应区划的ID,作为“真正唯一的关联数据(虽然不怎么用得到)”。而左值只能当作“非常有用的冗余数据”,做好一更新随时会被重写的准备。原因末尾“优势和弱点”一节会解释。

查询方法

根据号码查询单个区划的名称,查左值相等的就行了。

如果要列出所有的上级区划,尤其方便。由于区间包含是一个简单的数学关系,所以再也不必要像典型的存储父记录号码那样,费时费力去做回溯操作。

只要把包含区间的值的所有区间取出,就是这个区划的所有上级。并且,由于大区间的左值一定比小区间的小,所以只需要按照左值升序,就可以把区间从大到小排序。

例如查询

SELECT * FROM regiontable WHERE lbb3 ORDER BY lbb ASC

得到结果:

-------------------------------------
name    lbb   ubb   depth
-------------------------------------
吉林省   1     14    1
长春市   2     7     2
朝阳区   3     4     3
-------------------------------------

即吉林省-长春市-朝阳区。

遍历方法

数据表中存储了

SELECT * FROM regiontable WHERE lbb>左界 AND ubb

如果列出第一级那就只查depth=1就行了。

这个查询不仅可以用于行政区划表格,也可以用于用户数据表格。例如列出属于某区域的所有用户(已知此级别的左右界):

SELECT * FROM userinfo WHERE region>=左界 AND region

而无论对于多大的区域,这个查询效率的都是均等的高,彻底杜绝区域大了查不动。

优势和弱点

左右值法快就快在查询和排序都有数学的自然性。一步到位,无需回溯,效率是显而易见的。

而弱点同样显而易见:修改极其麻烦,并且往往是牵一发而动全身。一处写入,估计大半张表格都要跟着修改。算法就会很麻烦。

而这要注意对于任何一个记录,其左右值都是不稳定的,只能用于查询,绝对不能用来与数据表建立持久稳定的关系!这也就是前边说过一定要存区划ID的意义。

这个需求中,我们恰好使用了优势,而规避了弱点。因为行政区划数据天天查,但很少改。

具体地址怎么存?

像淘宝那样,把省市区放在一行内,摆在地址文本框的旁边,并明示用户:地址中不必再输入省市区。

如何应对不存在的省市区名称?

我推荐的方法是:提示用户能选到多细选多细,如果再细没有了,就放在具体地址前边,一起输入到地址文本框中。

我是绝对反对整几个小文本框,给用户在找不到自己的省市区的时候,去自定义输入的。
理由也很简单:就算我们的行政区划数据库再老,再不准确,那也能保证99%的人都能找到自己的地址。
所以这个思路看似很自然(没有就自定义嘛!),但其实是在为了1%的需求投入100%的开发精力,到头来是极其愚蠢和低效的。

数据哪里来?

要求不高的,维基百科去抄,或者到别的程序里去扒。

要求高的,去买民政部出的《中华人民共和国行政区划简册2013》,权威性没商量。

注意港澳台的行政区划问题。我建议以下的方案:

  • 香港、澳门特别行政区,仅列在中华人民共和国下,不列入单独的国家/地区。

  • 中华人民共和国下存在台湾省,但不再向下延伸;

  • 第一级国家/地区(如果有的话)单列台湾,并按维基百科资料,或参考台湾执政部门资料,填入对应的下级行政区域。最好使用正体(繁体)中文。

  • 另外,小心使用洋人做的国家列表。要是一不小心新疆和西藏单列了国家和地区,就自己考虑后果吧。

今天关于《分享我实现行政区划层级的思路方法!》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于mysql的内容请关注golang学习网公众号!

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表