Go by Example: Stringhe e Rune

Una stringa Go è una slice di sola lettura di byte. Il linguaggio e la libreria standard trattano le stringhe in modo speciale - come contenitori di testo codificato in UTF-8. In altri linguaggi, le stringhe sono costituite da “caratteri”. In Go, il concetto di carattere è chiamato `rune` - è un intero che rappresenta un punto di codice Unicode. Questo post del blog Go è una buona introduzione all’argomento.
	`package main`
	`import ( "fmt" "unicode/utf8" )`
	`func main() {`
`s` è una `string` a cui è assegnato un valore letterale che rappresenta la parola “ciao” in lingua thailandese. I letterali stringa Go sono testo codificato UTF-8.	`const s = "สวัสดี"`
Poiché le stringhe sono equivalenti a `[]byte`, questo produrrà la lunghezza dei byte grezzi memorizzati all’interno.	`fmt.Println("Len:", len(s))`
L’indicizzazione di una stringa produce i valori di byte grezzi a ogni indice. Questo ciclo genera i valori esadecimali di tutti i byte che costituiscono i punti di codice in `s`.	`for i := 0; i < len(s); i++ { fmt.Printf("%x ", s[i]) } fmt.Println()`
Per contare quante rune ci sono in una stringa, possiamo usare il pacchetto `utf8`. Nota che il tempo di esecuzione di `RuneCountInString` dipende dalla dimensione della stringa, perché deve decodificare ogni rune UTF-8 sequenzialmente. Alcuni caratteri thailandesi sono rappresentati da punti di codice UTF-8 che possono estendersi su più byte, quindi il risultato di questo conteggio potrebbe essere sorprendente.	`fmt.Println("Rune count:", utf8.RuneCountInString(s))`
Un ciclo `range` gestisce le stringhe in modo speciale e decodifica ogni `rune` insieme al suo offset nella stringa.	`for idx, runeValue := range s { fmt.Printf("%#U starts at %d\n", runeValue, idx) }`
Possiamo ottenere la stessa iterazione usando esplicitamente la funzione `utf8.DecodeRuneInString`.	`fmt.Println("\nUsing DecodeRuneInString") for i, w := 0, 0; i < len(s); i += w { runeValue, width := utf8.DecodeRuneInString(s[i:]) fmt.Printf("%#U starts at %d\n", runeValue, i) w = width`
Questo dimostra il passaggio di un valore `rune` a una funzione.	`examineRune(runeValue) } }`
	`func examineRune(r rune) {`
I valori racchiusi tra virgolette singole sono letterali rune. Possiamo confrontare un valore `rune` con un letterale rune direttamente.	`if r == 't' { fmt.Println("found tee") } else if r == 'ส' { fmt.Println("found so sua") } }`

$ go run stringhe-e-rune.go
Len: 18
e0 b8 aa e0 b8 a7 e0 b8 b1 e0 b8 aa e0 b8 94 e0 b8 b5 
Rune count: 6
U+0E2A 'ส' starts at 0
U+0E27 'ว' starts at 3
U+0E31 'ั' starts at 6
U+0E2A 'ส' starts at 9
U+0E14 'ด' starts at 12
U+0E35 'ี' starts at 15

Using DecodeRuneInString
U+0E2A 'ส' starts at 0
found so sua
U+0E27 'ว' starts at 3
U+0E31 'ั' starts at 6
U+0E2A 'ส' starts at 9
found so sua
U+0E14 'ด' starts at 12
U+0E35 'ี' starts at 15

Prossimo esempio: Struct.

Go by Example: Stringhe e Rune 🌙

Go by Example: Stringhe e Rune