Re: Sulla scrittura di simbolo matematici nei forum

From: Soviet_Mario <SovietMario_at_CCCP.MIR>
Date: Sat, 22 Feb 2020 11:28:10 +0100

On 21/02/20 15:29, posi wrote:
> Il 21/02/20 11:30, Soviet_Mario ha scritto:
>> On 20/02/20 23:25, posi wrote:
>>> Il 18/02/20 22:45, Furio Petrossi ha scritto:
>>>
>>>> A questo proposito correggo una falsa contrapposizione,
>>>> da me creata:
>>>> dalla versione 3, se non erro, Mathjax ha deciso di
>>>> incorporare
>>>> AsciiMath, per cui anche in quell'ambiente è possibile
>>>> una scrittura
>>>> semplificata.
>>>>
>>>> Semplificata fino ad un certo punto (*)... - Velocità
>>>> media: bar
>>>> v=(Delta s) / (Delta t) ; bar v è la lettera "v" con
>>>> sopra una
>>>> barretta;
>>>>
>>>> - Legge di Coulomb: vec F =1/(4 pi epsilon_0) (q_1
>>>> *q_2)/r^2 hat r ;
>>>> vec Fmette una freccetta sopra la lettera F, mentre hat
>>>> r - che
>>>> indica un versore - mette sopra r un accento
>>>> circonflesso; gli indici
>>>> sono collegati alla lettera che la precede dal segno di
>>>> sottolineatura _;
>>>>
>>>
>>>
>>> Ma non è più semplice e leggibile una scrittura
>>> plain-text unicode tipo questa?
>>>
>>> �-- = 1/(4πε₀) (q₁q₂)/r² �"
>>
>> il mio sistema usa UTF-8 encoding
>
> Sì, UTF-8 è unicode.

no no, unicode codifica wide char
UTF-8 è "variable length", nel senso che supporta da 1 a 3
(forse 4) byte per carattere.

>
>> In effetti il primo e penultimo simbolo mi appaiono deome
>> punti interrogativi bianchi in un ovale pieno nero.
>
> Non è colpa tua, è il robomoderatore ad aver fatto un po' di
> pasticci su quei due caratteri.
> Ho inviato la stessa formula su it.test e mi sembra si legga.
>
> Inoltre i simboli che ho usato non erano giusti.
> Quelli giusti dovrebbero essere questi:
>
> F⃗ = 1/(4πε₀) (q₁q₂)/r² r̂

è corretto vedere una r con accento circonflesso ?

>
>> Non esiste una codifica plain-text realmente portabile
>> salvo il 7-bit ASCII.
>>
>
> Non esageriamo, l'unicode ormai è supportato ovunque. Del

ci mancherebbe ! Anche un sistema linux sa che moltissima
parte dei PC con cui scambierà dati sono macchine windows
usanti unicode.
Ma è una questione di opportunità, e le implementazioni di
programmi entro il sistema possono anche essere un po' bacate.

> resto tu stesso stai usando le vocali accentate, che sono
> non-ASCII.

non so cosa alla fine usi Thunderbird. I font e le stringhe
native di Debian sono UTF-8 non unicode, ma cmq anche
unicode è supportato.

tra l'altro questa cosa rompe dannatissimamente i coglioni
nei programmi dove si maneggiano stringhe, perché persino il
computo dei byte vs caratteri gioca dei brutti scherzi se
già non conosci a priori il tipo di codifica.

>
> Per π o ∆ è la stessa cosa.
>
> Altri simboli un po' più particolari o combinazioni insolite
> potrebbero non essere rese ottimamente oppure del tutto
> ignorate.

in genere UTF-8 riesce a includere la maggior parte dei
simboli unicode come sequenze valide.
Però ci sono alcuni (credo limitati) range di codici che
sono validi o solo in unicode o solo in UTF
nel qual caso vengono resi un po' a cazzo dai programmi
utente che cercano cmq di preservare la resa di tutto il
resto anche dopo un codice invalido (che viene
"circoscritto" al minimo danno per il seguito)
.
UTF-8 è molto compatto come occupazione di spazio, grazie
alla variable size, ma ha una codifica non "assoluta", nel
senso che nei multibyte la validità dello stato di un byte a
volte dipende dalla "storia" degli 1 o 2 byte che lo precedono.
Se non ricordo male unicode è "assoluto" nel senso che ogni
sequenza è in teoria valida
La forte affermazione di unicode ha portato a introdurre ad
es. in C la dichiarazione "wide char" per le stringhe non ASCII.
Quel che forse non è sempre vero è che non sempre un FONT
selezionato contiene simboli per tutte le 65536 combinazioni
del dato wide char, per cui si possono avere simboli che,
ancorché validi come stringa, non riescono a essere resi
bene perché o il Font non è dichiarato oppure non è
"embedded" nell'oggetto e nemmeno installato nel sistema, a
quel punto il programma che renderizza il testo si deve
arrendere ed emettere un simbolo di default.

Il trattamento del testo è tra le più fastidiose e
frustranti problematiche quando pensi a gestione "generica"
delle stringhe di testo (seconda però alla gestione dei
formati DATA/ORA dove ci si addentra nell'esoterismo puro)


-- 
1) Resistere, resistere, resistere.
2) Se tutti pagano le tasse, le tasse le pagano tutti
Soviet_Mario - (aka Gatto_Vizzato)
Received on Sat Feb 22 2020 - 11:28:10 CET

This archive was generated by hypermail 2.3.0 : Thu Nov 21 2024 - 05:10:00 CET