The UNIX and Linux Forums  
Hej och välkommen från USA till UNIX och Linux Forum! Tack för ditt besök och gå med i vår globala gemenskapen.

Go Back   UNIX och Linux Forum > Upp Forum > UNIX för avancerade & Expertanvändare
.
google unix.com



UNIX för avancerade & Expertanvändare Expert-to-experten. Läs avancerade UNIX UNIX-kommandon, Linux operativsystem, systemadministration, programmering, Shell, Shell Scripts, Solaris, Linux, HP-UX, AIX, OS X, BSD.

Mer UNIX och Linux Forum Ämnen Du kan hitta Helpful
Tråd Thread Starter Forum Svar Senaste Inlägg
Extrahera det sista tecknet i en sträng annelisa Shell-programmering och Skript 8 07-04-2008 11:57
Hur man extraherar första kolonnen med en särart selamba_warrior Shell-programmering och Skript 3 05-22-2008 05:14
dellicens tecken + 1 francis_tom Shell-programmering och Skript 1 04-21-2008 12:16
grep eller awk problem, inte för att hämta nummer baghera Shell-programmering och Skript 7 08-31-2007 04:42
Extrahera en karaktär aajan UNIX för avancerade & Expertanvändare 10 08-20-2007 10:03

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Sök i denna tråd Rate Thread Visningslägen
  #1 (permalänk)  
Old 08-31-2008
cosec cosec is offline
Registered User
  
 

Join Date: Sep 2007
Inlägg: 12
inte extrahera Trademark (™) Karaktär

Hej Alla,

Jag försöker att extrahera ett varumärke karaktär (™) från en varchar kolumn i ett DB2 tabell. Resultatet är att placeras i en sekventiell fil i en AIX miljön.

Efter Extraktion är fullständig när jag visar den extraherade filen jag märkt att i stället för (™) Tecken en markerad karaktär SUB har placerats.

Det vore bra om någon kan sprida lite ljus på varför det inte visas (™) Tecken. Kan det vara så eftersom AIX typset inte tillåter denna särskilda karaktär?

Skulle uppskatta ditt råd. Tack
  #2 (permalänk)  
Old 08-31-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Join Date: maj 2008
Plats: Sydney, Australien
Inlägg: 1009
Citat:
Ursprungligen postat av cosec View Post
Kan det vara så eftersom AIX typset inte tillåter denna särskilda karaktär?
Ja. Men om ni kunde ladda utdatafilen i en liknande miljö till en där du tittar på data från början bör du fortfarande se TM karaktär, som på en binär nivå det bör vara oförändrad.
  #3 (permalänk)  
Old 09-01-2008
eran era is offline Forum Advisor  
Herder av Useless Cats (På sabbatsår)
  
 

Join Date: mars 2008
Ort: / det är / / bara / bin / sh
Inlägg: 3652
Det finns inget sådant som en "AIX typset". Det finns bytes i filen, och det är din terminal, och det finns flera konventioner för hur man kan visa bytes i filen av någon särskild terminal. Om du vet typset kodning för filen, och karaktären repertoar av din terminal kan du förutse hur ett visst byte sekvens kommer att visas, men om det ena eller det andra är okänd, det är ganska svårt att säga vad du kan förvänta dig ( eller ens verkligen vad ni pratar om).

Plain 7-bitars data brukar visas som ASCII, vilket är helt väldefinierade, men (tm)-tecknet är inte en del av 7-bitars ASCII-tecken, du är uppenbarligen visa fil under två olika tolkningar av natur - uppsättning kodningen i filen, kanske med hjälp av två olika terminaler, eller olika verktyg som ställer olika antaganden. (På AIX kanske har du möjlighet att lägga EBCDIC i mixen, men låt oss inte gå dit.)

Hur som helst, för att felsöka detta kanske du vill använda en hex dump verktyg (od, xxd, hexdump, Eller till och med bara katt-A) För att inspektera vad de faktiska bytes i filen. När du vet att det inte borde vara svårt att räkna ut vilken kodning ger tolkning du vill, och / eller konvertera filen till representation du vill.
  #4 (permalänk)  
Old 09-01-2008
cosec cosec is offline
Registered User
  
 

Join Date: Sep 2007
Inlägg: 12
Tack för svaret .. jag fick reda på att kodning teckenuppsättning som används är ISO8859-1 och har inte Trademark tecken. Varumärket karaktär är ett reserverat ord och det visas som SUB.

Är det möjligt att konvertera filen till en annan med-fil med en annan kodning teckenuppsättning och kunna visa Trademark karaktär?

Om ja, hur kunde det ske via UNIX?

Tack
  #5 (permalänk)  
Old 09-01-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Join Date: maj 2008
Plats: Sydney, Australien
Inlägg: 1009
Då behöver ni för att visa Trademark karaktär? I en AIX terminalsession av något slag? Eller i vissa program eller klient som ansluter till servern? Eller på något annat system att uppgifterna kommer att överföras till?
  #6 (permalänk)  
Old 09-02-2008
eran era is offline Forum Advisor  
Herder av Useless Cats (På sabbatsår)
  
 

Join Date: mars 2008
Ort: / det är / / bara / bin / sh
Inlägg: 3652
Den stora frågan är i vilken teckenuppsättning du se varumärke tecken, eller, som ISO-8859-1 karaktär är det du ser som en del tecken (vad det är?)

I ASCII finns en kontroll karaktär SUB (Ctrl-Z), som har karaktären nummer 26 decimal (oktal 032, hex 0x1A) - är det vad du har i ditt ärende? Vad skulle vara ett användbart kodning att överföra det till? Följande kommer att översätta alla händelser av denna karaktär kod i Unicode varumärkessymbol karaktär U 2122 i UTF-8-kodning:

Kod:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8
Eller i ISO-8859-1 är det Registrerad underteckna ® vid kod punkt 0xAE, skulle det vara ett bra alternativ?

Kod:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1
Detta förutsätter att UNDERENHETER karaktär verkligen är tecken nummer 0x1A, om det inte, men du kan ta reda på vad det är i stället bör det triviala att anpassa någon av dessa en-liners till något som fungerar för dig. Vissa Windows kodsidor har varumärkessymbol på 0x99 så det kan vara en sak att pröva om 0x1A inte fungerar för dig (men återigen, om du kan titta på de outspädda bytes i filen, behöver du inte gissa) .

Senast redigerad av era; 09-02-2008 vid 01:59.. Anledning: Lägg ISO8859-1 ® substitution; kommentar om Windows 0x99 tecken
Closed Thread

Komihåglista

Taggar
typset, kodning

Thread Tools Sök i denna tråd
Sök i denna tråd:

Avancerad sökning
Visningslägen Betygsätt denna tråd
Betygsätt denna tråd:

Utstationering Regler
Du får inte efter nya trådar
Du får inte efter svar
Du får inte skicka bilagor
Du får inte redigera dina inlägg

BB-kod är På
Smilies är På
[IMG] kod PÃ¥
HTML-koden är Av
Trackback är På
Pingbacks är På
Refbacks är På




Alla tider är GMT -4. Klockan är nu 04:29.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Översättningar Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX och Linux Forum Innehållet upphovsrättsskyddat © 1993-2009. All Rights Reserved.Ad förvaltning RedTyger

Content Relevant webbadresser från vBSEO 3.2.0