The UNIX and Linux Forums  

Go Back   UNIX e Linux Forum > Inizio Forum > UNIX e avanzata per utenti esperti
.
google unix.com



UNIX e avanzata per utenti esperti Expert-to-Expert. Ulteriori avanzata UNIX, comandi UNIX, Linux, Sistemi Operativi, System Administration, Programmazione, Shell, Shell Script, Solaris, Linux, HP-UX, AIX, OS X, BSD.

Più di UNIX e Linux Forum Argomenti potreste trovare utili
Filo Thread Starter Forum Risposte Ultimo Post
Estrarre l'ultimo carattere di una stringa annelisa Shell scripting e di programmazione 8 07-05-2008 12:57 AM
Come estrarre prima colonna con un carattere specifico selamba_warrior Shell scripting e di programmazione 3 05-22-2008 06:14 AM
estratto carattere + 1 francis_tom Shell scripting e di programmazione 1 04-21-2008 01:16 PM
grep o awk problema, in grado di estrarre i numeri Baghera Shell scripting e di programmazione 7 08-31-2007 05:42 PM
Estratto di un carattere aajan UNIX e avanzata per utenti esperti 10 08-20-2007 AM 11:03

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Cerca in questo Thread Rate Thread Modalità di visualizzazione
  #1 (permalink)  
Old 08-31-2008
cosec cosec is offline
Utente Registrato
  
 

Iscriviti Data: Sep 2007
Interventi: 12
in grado di estrarre Trademark (â„¢) Carattere

Ciao Tutti,

Sto cercando di estrarre un marchio carattere (™) da una colonna varchar in una tabella DB2. Il risultato è quello di essere messi in un file sequenziale in un ambiente AIX.

Dopo l'estrazione è completa quando visualizzare il file estratto ho notato che al posto del (™) ha evidenziato un altro carattere Carattere SUB è stata iscritta.

Sarebbe bello se qualcuno può fare luce sul motivo per cui essa non viene visualizzata la (™) di caratteri. Potrebbe essere perché il set di caratteri AIX non permettere che questo carattere speciale?

Gradirei il vostro consiglio. Thank You
  #2 (permalink)  
Old 08-31-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Iscriviti Data: maggio 2008
Località: Sydney, Australia
Interventi: 1.009
Citazione:
Originalmente inviato da cosec View Post
Potrebbe essere perché il set di caratteri AIX non permettere che questo carattere speciale?
Sì. Tuttavia, se si dovesse caricare il file di output in un ambiente simile a quello in cui si è stati la visualizzazione dei dati originariamente si deve ancora vedere la TM carattere, come in un binario di livello dovrebbe essere invariato.
  #3 (permalink)  
Old 09-01-2008
epoca era is offline Forum Advisor  
Herder di Inutile Gatti (Su sabbatico)
  
 

Iscriviti Data: marzo 2008
Ubicazione: / ci / è / solo / bin / sh
Interventi: 3.652
Non c'è cosa come un "AIX set di caratteri". Ci sono in byte del file, e vi è il terminale, e non ci sono più le convenzioni per il modo per visualizzare i byte del file su qualsiasi particolare terminale. Se conoscete il set di caratteri di codifica del file, e il carattere del repertorio il terminale, si può prevedere come una particolare sequenza di byte verrà visualizzato, ma se uno o l'altro non è noto, è piuttosto difficile dire cosa si deve aspettare ( o addirittura in realtà quello che si sta parlando).

Pianura 7-bit di dati è in genere visualizzato come ASCII, che è ben definita, ma la (tm), il carattere non fa parte del 7-bit set di caratteri ASCII, siete voi che apparentemente la visualizzazione di file in due diverse interpretazioni del personaggio - impostare la codifica del file, magari con due terminali diversi, o diversi strumenti che impongono le diverse ipotesi. (Su AIX forse hai la possibilità di aggiungere in EBCDIC il mix, ma non andare là.)

Comunque, per risolvere questo, si potrebbe desiderare di utilizzare uno strumento hex dump (od, xxd, hexdump, O anche solo cat-A) Per controllare ciò che il reale byte del file. Una volta che si sa che, non dovrebbe essere difficile capire che dà l'interpretazione di codifica che si desidera, e / o convertire i file per la rappresentazione desiderata.
  #4 (permalink)  
Old 09-01-2008
cosec cosec is offline
Utente Registrato
  
 

Iscriviti Data: Sep 2007
Interventi: 12
Grazie per la risposta .. ho scoperto che la codifica dei set di caratteri utilizzato è ISO8859-1 e non ha il marchio segno. Il marchio è un carattere riservato e non vi parola visualizzata come SUB.

E 'possibile convertire il file con un altro file con un diverso set di caratteri di codifica ed essere in grado di visualizzare il marchio carattere?

In caso affermativo, come potrebbe essere fatto tramite unix?

Grazie
  #5 (permalink)  
Old 09-01-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Iscriviti Data: maggio 2008
Località: Sydney, Australia
Interventi: 1.009
Se avete bisogno di visualizzare il marchio carattere? In una sessione di terminale AIX di qualche tipo? Oppure in qualche applicazione o client che si connette al server? O su qualche altro sistema che i dati potranno essere trasferiti a?
  #6 (permalink)  
Old 09-02-2008
epoca era is offline Forum Advisor  
Herder di Inutile Gatti (Su sabbatico)
  
 

Iscriviti Data: marzo 2008
Ubicazione: / ci / è / solo / bin / sh
Interventi: 3.652
La grande questione è nel set di caratteri che si fa vedere il marchio segno, o, che ISO-8859-1 carattere stai vedendo come un carattere SUB (qualunque essa sia?)

In ASCII vi è un carattere di controllo SUB (Ctrl-Z), che ha il carattere di codice 26 decimale (032 ottale, esadecimale 0x1A) - è che quello che hai nel tuo file? Quale potrebbe essere un utile di codifica per il trasferimento a? Quanto segue tradurre tutte le occorrenze di questo tipo di codice in Unicode marchio simbolo carattere U 2122 nella codifica UTF-8:

Codice:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8
O nella norma ISO-8859-1, vi è il segno Registrato ® al codice 0xAE punto, sarebbe utile che essere un sostituto?

Codice:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1
Questo presuppone che il carattere è davvero SUB carattere codice 0x1A; se non lo è, ma si può scoprire che cosa è, invece, dovrebbe essere banale per adattare uno di questi uno-liners a qualcosa che funziona per voi. Alcune pagine di codice di Windows hanno il simbolo di marchio a 0x99 in modo che potrebbe essere una cosa da provare se 0x1A non funziona per voi (ma anche in questo caso, se è possibile guardare il greggio in byte del file, non devi indovinare) .

Ultimo a cura di epoca; al 09/02/2008 02:59 AM.. Motivo: Aggiungi ISO8859-1 ® sostituzione; annotazione su Windows 0x99 caratteri
Closed Thread

Segnalibri

Tag
set di caratteri, codifica

Thread Tools Cerca in questo Thread
Cerca in questo Thread:

Ricerca Avanzata
Modalità di visualizzazione Vota questo thread
Vota questo thread:

Distacco regolamento
Tu non può post nuovo thread
Tu non può inviare una risposta
Tu non può postare allegati
Tu non può modificare i tuoi post

BB codice è Su
Smilies sono Su
[IMG] codice Su
Codice HTML è Chiuso
Trackbacks sono Su
Pingbacks sono Su
Refbacks sono Su




Tutti gli orari sono GMT -4. La data di oggi è 07:17 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traduzioni Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX e Linux Forum Content Copyright © 1993-2009. Tutti i diritti Reserved.Ad di gestione da RedTyger

Contenuti pertinenti URL da vBSEO 3.2.0