![]() |
Hej och välkommen från USA till UNIX och Linux Forum! Tack för ditt besök och gå med i vår globala gemenskapen.
|
|
google unix.com
|
|||||||
| Forum | Registrera | Forum Regler | Länkar | Album | FAQ | Medlemslista | Kalender | Söka | Dagens inlägg | Markera forum som lästa |
| UNIX för avancerade & Expertanvändare Expert-to-experten. Läs avancerade UNIX UNIX-kommandon, Linux operativsystem, systemadministration, programmering, Shell, Shell Scripts, Solaris, Linux, HP-UX, AIX, OS X, BSD. |
Mer UNIX och Linux Forum Ämnen Du kan hitta Helpful
|
||||
| Tråd | Thread Starter | Forum | Svar | Senaste Inlägg |
| Extrahera det sista tecknet i en sträng | annelisa | Shell-programmering och Skript | 8 | 07-04-2008 11:57 |
| Hur man extraherar första kolonnen med en särart | selamba_warrior | Shell-programmering och Skript | 3 | 05-22-2008 05:14 |
| dellicens tecken + 1 | francis_tom | Shell-programmering och Skript | 1 | 04-21-2008 12:16 |
| grep eller awk problem, inte för att hämta nummer | baghera | Shell-programmering och Skript | 7 | 08-31-2007 04:42 |
| Extrahera en karaktär | aajan | UNIX för avancerade & Expertanvändare | 10 | 08-20-2007 10:03 |
![]() |
|
|
LinkBack | Thread Tools | Sök i denna tråd | Rate Thread | Visningslägen |
|
|
|
#1 (permalänk)
|
||||
|
||||
|
inte extrahera Trademark (™) Karaktär
Hej Alla,
Jag försöker att extrahera ett varumärke karaktär (™) från en varchar kolumn i ett DB2 tabell. Resultatet är att placeras i en sekventiell fil i en AIX miljön. Efter Extraktion är fullständig när jag visar den extraherade filen jag märkt att i stället för (™) Tecken en markerad karaktär SUB har placerats. Det vore bra om någon kan sprida lite ljus på varför det inte visas (™) Tecken. Kan det vara så eftersom AIX typset inte tillåter denna särskilda karaktär? Skulle uppskatta ditt råd. Tack |
|
#2 (permalänk)
|
||||
|
||||
|
Ja. Men om ni kunde ladda utdatafilen i en liknande miljö till en där du tittar på data från början bör du fortfarande se TM karaktär, som på en binär nivå det bör vara oförändrad.
|
|
#3 (permalänk)
|
||||
|
||||
|
Det finns inget sådant som en "AIX typset". Det finns bytes i filen, och det är din terminal, och det finns flera konventioner för hur man kan visa bytes i filen av någon särskild terminal. Om du vet typset kodning för filen, och karaktären repertoar av din terminal kan du förutse hur ett visst byte sekvens kommer att visas, men om det ena eller det andra är okänd, det är ganska svårt att säga vad du kan förvänta dig ( eller ens verkligen vad ni pratar om).
Plain 7-bitars data brukar visas som ASCII, vilket är helt väldefinierade, men (tm)-tecknet är inte en del av 7-bitars ASCII-tecken, du är uppenbarligen visa fil under två olika tolkningar av natur - uppsättning kodningen i filen, kanske med hjälp av två olika terminaler, eller olika verktyg som ställer olika antaganden. (På AIX kanske har du möjlighet att lägga EBCDIC i mixen, men låt oss inte gå dit.) Hur som helst, för att felsöka detta kanske du vill använda en hex dump verktyg (od, xxd, hexdump, Eller till och med bara katt-A) För att inspektera vad de faktiska bytes i filen. När du vet att det inte borde vara svårt att räkna ut vilken kodning ger tolkning du vill, och / eller konvertera filen till representation du vill. |
|
#4 (permalänk)
|
||||
|
||||
|
Tack för svaret .. jag fick reda på att kodning teckenuppsättning som används är ISO8859-1 och har inte Trademark tecken. Varumärket karaktär är ett reserverat ord och det visas som SUB.
Är det möjligt att konvertera filen till en annan med-fil med en annan kodning teckenuppsättning och kunna visa Trademark karaktär? Om ja, hur kunde det ske via UNIX? Tack |
|
#5 (permalänk)
|
||||
|
||||
|
Då behöver ni för att visa Trademark karaktär? I en AIX terminalsession av något slag? Eller i vissa program eller klient som ansluter till servern? Eller på något annat system att uppgifterna kommer att överföras till?
|
|
#6 (permalänk)
|
||||
|
||||
|
Den stora frågan är i vilken teckenuppsättning du se varumärke tecken, eller, som ISO-8859-1 karaktär är det du ser som en del tecken (vad det är?)
I ASCII finns en kontroll karaktär SUB (Ctrl-Z), som har karaktären nummer 26 decimal (oktal 032, hex 0x1A) - är det vad du har i ditt ärende? Vad skulle vara ett användbart kodning att överföra det till? Följande kommer att översätta alla händelser av denna karaktär kod i Unicode varumärkessymbol karaktär U 2122 i UTF-8-kodning: Kod:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8 Kod:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1 Senast redigerad av era; 09-02-2008 vid 01:59.. Anledning: Lägg ISO8859-1 ® substitution; kommentar om Windows 0x99 tecken |
![]() |
| Komihåglista |
| Taggar |
| typset, kodning |
| Thread Tools | Sök i denna tråd |
| Visningslägen | Betygsätt denna tråd |
|
|