登录
首页 >  Golang >  Go问答

golang sort.Strings 与 unix sort,如何根据给定的排序规则进行排序?

来源:stackoverflow

时间:2024-04-13 23:00:36 138浏览 收藏

大家好,今天本人给大家带来文章《golang sort.Strings 与 unix sort,如何根据给定的排序规则进行排序?》,文中内容主要涉及到,如果你对Golang方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!

问题内容

我有一段时间感到困惑,因为这两种排序方法的行为不同,或者至少在我的环境中是不同的。过了一会儿,我意识到这是因为排序规则不同。

一个快速实验说明了我的观点:

$ foo() { echo "o'4" "o'neil" o-ciclo-music ó-do-forró  o-1 o-2 o-3 "o'" "o'1"  "o'2" aaa b bb; } 
$ foo | s2n | lc_all=c  sort  > /tmp/s.c
$ foo | s2n | lc_all="en_us.utf-8" sort  > /tmp/s.u
$ paste /tmp/s.{c,u}  | awk '{ printf "%16s %s\n", $1 , $2 ; }'
             aaa aaa
               b b
              bb bb
              o' o'
             o'1 o'1
             o'2 o-1
             o'4 o'2
          o'neil o-2
             o-1 o-3
             o-2 o'4
             o-3 o-ciclo-music
   o-ciclo-music ó-do-forró
      ó-do-forró o'neil

左列根据ascii规则排序,右列根据utf8规则排序。 golang sort.strings() 根据 ascii 规则运行。该函数基于 <= 运算符,并且它们依次对整数进行运算。因此,这些单词将根据其字母的 ascii 序数值进行排序。

是否可以根据某些环境变量影响 sort.strings() 的行为?我尝试过使用 lc_all 变量,但 golang 中的 'a' < 'b' 行为不受此影响。这可能是为了更好。

我想知道哪个包提供了具有相同签名(和返回类型)的函数 与 strings.compare() 一样,但会注意一些任意的排序规则集(或至少是 unicode)。

我想要一个函数来指示 o'neil 应该出现在 ó-do-forró 之后。

foobar.SetCollation(unicode)
       foobar.Compare(`o'neil`, `ó-do-forró`) -> 1

我正在寻找什么包?


正确答案


import  "golang.org/x/text/collate"

(...)

cull := collate.New(language.English,
    collate.IgnoreCase, collate.IgnoreDiacritics, collate.IgnoreWidth, 
    collate.Loose,
    collate.Force,
    collate.Numeric)
println(cull.CompareString( "o'neil", "ó-do-forró", )) // prints 1
println(cull.CompareString( "b", "a", )) // prints 1

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《golang sort.Strings 与 unix sort,如何根据给定的排序规则进行排序?》文章吧,也可关注golang学习网公众号了解相关技术文章。

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>