문자로만 구성된 임의 문자열(대문자 또는 소문자)만 원합니다. ), Go에서는 숫자가 없습니다. 이를 수행하는 가장 빠르고 간단한 방법은 무엇입니까?
질문은 "가장 빠르고 간단한" 접근 방식을 추구합니다. Paul의 답변은 간단한 기술을 제공합니다. 그러나 "가장 빠른" 측면도 고려해 보겠습니다. 코드를 반복적으로 개선하여 최적화된 솔루션에 도달하겠습니다.
1. 창세기(룬)
최적화할 초기 솔루션은 다음과 같습니다.
import (
"math/rand"
"time"
)
var letterRunes = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")
func RandStringRunes(n int) string {
b := make([]rune, n)
for i := range b {
b[i] = letterRunes[rand.Intn(len(letterRunes))]
}
return string(b)
}
2. 바이트
임의의 문자열에 사용되는 문자가 대문자와 소문자 영어 알파벳으로 제한되는 경우 영어 알파벳 문자가 UTF-8 인코딩의 바이트에 1:1로 매핑되므로 바이트로 작업할 수 있습니다( Go는 문자열을 저장하는 데 사용합니다).
따라서 다음을 대체할 수 있습니다.
var letters = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")
with:
var letters = []byte("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")
또는 더 나은 방법:
const letters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
이것은 이제 const를 사용할 수 있기 때문에 상당한 개선이 이루어졌습니다(Go는 문자열 상수를 지원하지만 슬라이스 상수는 지원하지 않음). 또한 len(문자) 표현식도 상수입니다.
3. 나머지
이전 솔루션에서는 rand.Intn()(Rand.Intn() 및 추가로 Rand.Int31n()에 위임)을 호출하여 문자에 대한 난수를 결정했습니다.
이것은 63개의 임의 비트로 난수를 생성하는 rand.Int63()을 사용하는 것보다 느립니다.
따라서 간단히 rand.Int63()을 호출하고 len(문자)로 나눈 후 나머지를 사용할 수 있습니다. &&&]
func RandStringBytesRmndr(n int) string {
b := make([]byte, n)
for i := range b {
b[i] = letters[rand.Int63() % int64(len(letters))]
}
return string(b)
}
이 방법은 모든 문자의 동일한 확률 분포를 유지하면서 더 빠릅니다(비록 왜곡은 무시할 수 있지만 52개의 문자 수는 14. 마스킹
문자 수를 나타낼 수 있을 만큼 난수의 가장 낮은 비트만 사용하여 문자의 균등한 분포를 유지할 수 있습니다. 52개의 문자에는 6비트가 필요합니다: 52 = 110100b. 따라서 rand.Int63()에서 반환된 숫자의 가장 낮은 6비트만 사용합니다.또한 숫자가 0..len(letterBytes)-1 범위 내에 있는 경우에만 숫자를 "수락"합니다. . 가장 낮은 비트가 더 크면 폐기하고 새 숫자를 요청합니다.const (
letterIdxBits = 6 // 6 bits to represent a letter index
letterIdxMask = 15. 마스킹 개선됨
이전 솔루션은 rand.Int63()의 63개 임의 비트 중 가장 낮은 6비트만 사용했습니다. 무작위 비트를 얻는 것이 알고리즘에서 가장 느린 부분이기 때문에 이는 비효율적입니다.52개의 문자가 있으므로 6비트는 문자 인덱스를 코딩합니다. 63개의 무작위 비트는 63/6 = 10개의 다른 문자 인덱스를 지정할 수 있습니다. 10개를 모두 사용해 보겠습니다.const (
letterIdxBits = 6 // 6 bits to represent a letter index
letterIdxMask = 1= 0; {
if remain == 0 {
cache, remain = rand.Int63(), letterIdxMax
}
if idx := int(cache & letterIdxMask); idx >= letterIdxBits
remain--
}
return string(b)
}
6. 소스
마스크 개선은 매우 효율적입니다. 또 다른 측면을 고려해 봅시다: 난수의 소스.
crypto/rand 패키지는 Read(b []byte) 기능을 제공합니다. 그러나 crypto/rand는 속도가 느린 암호학적으로 안전한 의사 난수 생성기를 구현하기 때문에 성능에 도움이 되지 않습니다.그래서 우리는 math/rand 패키지를 고수하겠습니다. rand.Rand는 rand.Source를 무작위 비트의 소스로 사용합니다. 따라서 rand.Source를 직접 사용할 수 있습니다:var src = rand.NewSource(time.Now().UnixNano())
func RandStringBytesMaskImprSrc(n int) string {
b := make([]byte, n)
// A src.Int63() generates 63 random bits, enough for letterIdxMax characters!
for i, cache, remain := n-1, src.Int63(), letterIdxMax; i >= 0; {
if remain == 0 {
cache, remain = src.Int63(), letterIdxMax
}
if idx := int(cache & letterIdxMask); idx >= letterIdxBits
remain--
}
return string(b)
}
7. strings.Builder
이전 솔루션을 활용하면 먼저 슬라이스(Genesis의 []rune 및 이후 []byte)에서 구성된 문자열을 반환한 다음 문자열로 변환했습니다. 문자열 값은 변경할 수 없기 때문에 이 최종 변환에서는 슬라이스 내용을 복사해야 합니다.
Go 1.10에서는 strings.Builder가 도입되었습니다. 이 새로운 유형은 bytes.Buffer와 유사하게 문자열 내용을 작성하는 데 사용할 수 있습니다. 내부적으로 []바이트를 사용하며 문자열을 생성하기 위해 콘텐츠를 복사할 필요가 없습니다.func RandStringBytesMaskImprSrcSB(n int) string {
sb := strings.Builder{}
sb.Grow(n)
// A src.Int63() generates 63 random bits, enough for letterIdxMax characters!
for i, cache, remain := n-1, src.Int63(), letterIdxMax; i >= 0; {
if remain == 0 {
cache, remain = src.Int63(), letterIdxMax
}
if idx := int(cache & letterIdxMask); idx >= letterIdxBits
remain--
}
return sb.String()
}
8. unsafe
strings.Builder 패키지를 사용하여 strings.Builder를 "모방"하는 것은 우리가 직접 했던 것처럼 내부 []바이트에 문자열을 빌드합니다. 따라서 strings.Builder를 사용하면 약간의 오버헤드가 발생하므로 최종 복사를 피하기 위해 전환했습니다.
그러나 package unsafe:func RandStringBytesMaskImprSrcUnsafe( n int) 문자열 {
b := make([]바이트, n)
// src.Int63()은 letterIdxMax 문자에 충분한 63개의 임의 비트를 생성합니다!
i의 경우 캐시, 유지 := n-1, src.Int63(), letterIdxMax; 나는 >= 0; {
남아 있는 경우 == 0 {
캐시, 유지 = src.Int63(), letterIdxMax
}
if idx := int(cache & letterIdxMask); idx
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3