![]() |
|
|
google unix.com
|
|||||||
| Forum | Registrati | Regole Forum | Collegamenti | Album | FAQ | Members List | Calendario | Ricerca | Today's Posts | Mark Forums Read |
| UNIX e avanzata per utenti esperti Expert-to-Expert. Ulteriori avanzata UNIX, comandi UNIX, Linux, Sistemi Operativi, System Administration, Programmazione, Shell, Shell Script, Solaris, Linux, HP-UX, AIX, OS X, BSD. |
Più di UNIX e Linux Forum Argomenti potreste trovare utili
|
||||
| Filo | Thread Starter | Forum | Risposte | Ultimo Post |
| Estrarre l'ultimo carattere di una stringa | annelisa | Shell scripting e di programmazione | 8 | 07-05-2008 12:57 AM |
| Come estrarre prima colonna con un carattere specifico | selamba_warrior | Shell scripting e di programmazione | 3 | 05-22-2008 06:14 AM |
| estratto carattere + 1 | francis_tom | Shell scripting e di programmazione | 1 | 04-21-2008 01:16 PM |
| grep o awk problema, in grado di estrarre i numeri | Baghera | Shell scripting e di programmazione | 7 | 08-31-2007 05:42 PM |
| Estratto di un carattere | aajan | UNIX e avanzata per utenti esperti | 10 | 08-20-2007 AM 11:03 |
![]() |
|
|
LinkBack | Thread Tools | Cerca in questo Thread | Rate Thread | Modalità di visualizzazione |
|
|
|
||||
|
in grado di estrarre Trademark (â„¢) Carattere
Ciao Tutti,
Sto cercando di estrarre un marchio carattere (™) da una colonna varchar in una tabella DB2. Il risultato è quello di essere messi in un file sequenziale in un ambiente AIX. Dopo l'estrazione è completa quando visualizzare il file estratto ho notato che al posto del (™) ha evidenziato un altro carattere Carattere SUB è stata iscritta. Sarebbe bello se qualcuno può fare luce sul motivo per cui essa non viene visualizzata la (™) di caratteri. Potrebbe essere perché il set di caratteri AIX non permettere che questo carattere speciale? Gradirei il vostro consiglio. Thank You |
|
||||
|
Sì. Tuttavia, se si dovesse caricare il file di output in un ambiente simile a quello in cui si è stati la visualizzazione dei dati originariamente si deve ancora vedere la TM carattere, come in un binario di livello dovrebbe essere invariato.
|
|
||||
|
Non c'è cosa come un "AIX set di caratteri". Ci sono in byte del file, e vi è il terminale, e non ci sono più le convenzioni per il modo per visualizzare i byte del file su qualsiasi particolare terminale. Se conoscete il set di caratteri di codifica del file, e il carattere del repertorio il terminale, si può prevedere come una particolare sequenza di byte verrà visualizzato, ma se uno o l'altro non è noto, è piuttosto difficile dire cosa si deve aspettare ( o addirittura in realtà quello che si sta parlando).
Pianura 7-bit di dati è in genere visualizzato come ASCII, che è ben definita, ma la (tm), il carattere non fa parte del 7-bit set di caratteri ASCII, siete voi che apparentemente la visualizzazione di file in due diverse interpretazioni del personaggio - impostare la codifica del file, magari con due terminali diversi, o diversi strumenti che impongono le diverse ipotesi. (Su AIX forse hai la possibilità di aggiungere in EBCDIC il mix, ma non andare là .) Comunque, per risolvere questo, si potrebbe desiderare di utilizzare uno strumento hex dump (od, xxd, hexdump, O anche solo cat-A) Per controllare ciò che il reale byte del file. Una volta che si sa che, non dovrebbe essere difficile capire che dà l'interpretazione di codifica che si desidera, e / o convertire i file per la rappresentazione desiderata. |
|
||||
|
Grazie per la risposta .. ho scoperto che la codifica dei set di caratteri utilizzato è ISO8859-1 e non ha il marchio segno. Il marchio è un carattere riservato e non vi parola visualizzata come SUB.
E 'possibile convertire il file con un altro file con un diverso set di caratteri di codifica ed essere in grado di visualizzare il marchio carattere? In caso affermativo, come potrebbe essere fatto tramite unix? Grazie |
|
||||
|
Se avete bisogno di visualizzare il marchio carattere? In una sessione di terminale AIX di qualche tipo? Oppure in qualche applicazione o client che si connette al server? O su qualche altro sistema che i dati potranno essere trasferiti a?
|
|
||||
|
La grande questione è nel set di caratteri che si fa vedere il marchio segno, o, che ISO-8859-1 carattere stai vedendo come un carattere SUB (qualunque essa sia?)
In ASCII vi è un carattere di controllo SUB (Ctrl-Z), che ha il carattere di codice 26 decimale (032 ottale, esadecimale 0x1A) - è che quello che hai nel tuo file? Quale potrebbe essere un utile di codifica per il trasferimento a? Quanto segue tradurre tutte le occorrenze di questo tipo di codice in Unicode marchio simbolo carattere U 2122 nella codifica UTF-8: Codice:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8 Codice:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1 Ultimo a cura di epoca; al 09/02/2008 02:59 AM.. Motivo: Aggiungi ISO8859-1 ® sostituzione; annotazione su Windows 0x99 caratteri |
![]() |
| Segnalibri |
| Tag |
| set di caratteri, codifica |
| Thread Tools | Cerca in questo Thread |
| Modalità di visualizzazione | Vota questo thread |
|
|