The UNIX and Linux Forums  
Bonjour et bienvenu par les États-Unis à la UNIX et Linux Forums! Merci de votre visite et vous joindre à notre communauté mondiale.

Go Back   Les systèmes UNIX et Linux Forums > Top Forums > UNIX for Advanced & Expert Users
.
google unix.com



UNIX for Advanced & Expert Users Expert à Expert. Apprenez avancé UNIX, des commandes UNIX, Linux, les systèmes d'exploitation, d'administration système, de la Programmation, Shell, Shell Scripts, Solaris, Linux, HP-UX, AIX, OS X, BSD.

Plus d'UNIX et Linux Forum Sujets Vous trouverez peut-être utile
Fil Thread Starter Forum Réponses Last Post
Extrait du dernier caractère de la chaîne Annelisa De programmation et de script Shell 8 07-04-2008 11:57 PM
Comment faire pour extraire la première colonne avec un caractère spécifique selamba_warrior De programmation et de script Shell 3 05-22-2008 05:14 AM
extrait de caractère + 1 francis_tom De programmation et de script Shell 1 04-21-2008 12:16 PM
grep ou awk problème, l'incapacité d'extraire les numéros Baghera De programmation et de script Shell 7 08-31-2007 04:42 PM
Extrait d'un personnage aajan UNIX for Advanced & Expert Users 10 08-20-2007 10:03 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Recherche sur ce Thread Rate Thread Modes d'affichage
  #1 (permalink)  
Old 08-31-2008
COSEC cosec is offline
Registered User
  
 

Join Date: Sep 2007
Posts: 12
incapable d'en extraire des marques (™) de caractères

Bonjour tous,

Je suis en train d'extraire un caractère de marque (™) d'une colonne dans un varchar DB2 Table. Le résultat doit être placé dans un fichier séquentiel dans un environnement AIX.

Après l'extraction est terminée lorsque je visualiser le fichier, j'ai remarqué que, dans le lieu de la (™) d'un autre personnage mis en évidence le caractère SUB a été placé.

Ce serait génial si quelqu'un peut nous éclairer sur les raisons pour lesquelles il n'affiche pas le (™) de caractères. Serait-ce parce que le jeu de caractères AIX ne permet pas ce caractère?

Voulez-vous remercions de vos conseils. Merci
  #2 (permalink)  
Old 08-31-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Join Date: Mai 2008
Lieu: Sydney, Australie
Messages: 1009
Citation:
Posté par COSEC View Post
Serait-ce parce que le jeu de caractères AIX ne permet pas ce caractère?
Oui. Toutefois, si vous étiez à la charge le fichier de sortie dans un environnement similaire à celui où vous étiez en train de consulter les données d'abord, vous devez encore voir le caractère TM, au niveau binaire, il devrait rester inchangé.
  #3 (permalink)  
Old 09-01-2008
ère era is offline Forum Advisor  
Inutile de Herder Cats (en congé sabbatique)
  
 

Join Date: Mar 2008
Location: / il / est / que / bin / sh
Messages: 3652
Il n'y a pas de telle chose comme un "jeu de caractères AIX». Il existe des octets du fichier, et il est de votre terminal, et il existe plusieurs conventions pour la manière d'afficher les octets dans le fichier sur un terminal. Si vous connaissez le jeu de caractères d'encodage du fichier, et le répertoire de caractères de votre terminal, vous pouvez prédire comment toute la séquence d'octets sera affiché, mais si l'un ou l'autre est inconnu, il est très difficile de dire ce que vous devriez vous attendre ( ou même d'ailleurs de quoi vous parlez).

Plain 7-bit de données est généralement affiché comme ASCII, ce qui est bien défini, mais le (tm) caractère ne fait pas partie de la 7-bit ASCII character set, vous êtes apparemment le fichier affichés dans le cadre de deux interprétations différentes de la nature - codage dans le fichier, en utilisant peut-être deux terminaux, ou les différents outils qui imposent des différentes hypothèses. (Sur AIX peut-être vous avez la possibilité d'ajouter EBCDIC en le mélange, mais cela ne doit pas y aller.)

Quoi qu'il en soit, pour résoudre ce problème, vous voudrez peut-être utiliser un outil de dump hex (od, xxd, hexdump, Ou même seulement cat-A) À examiner ce que les octets du fichier. Une fois que vous le savez, il ne devrait pas être difficile de déterminer l'encodage qui donne l'interprétation que vous souhaitez, et / ou de convertir le fichier de la représentation que vous voulez.
  #4 (permalink)  
Old 09-01-2008
COSEC cosec is offline
Registered User
  
 

Join Date: Sep 2007
Posts: 12
Merci pour la réponse .. J'ai trouvé que le codage de caractères utilisé est ISO8859-1 et ne disposent pas des marques signer. Les marques de caractères est un mot réservé, et affiché comme SUB.

Est-il possible de convertir le fichier à l'autre avec des fichiers avec un encodage de caractères et être en mesure d'afficher les marques de caractère?

Si oui, comment pourrait-il être fait par unix?

Merci
  #5 (permalink)  
Old 09-01-2008
Annihilannic Annihilannic is offline Forum Advisor  
â„¢
  
 

Join Date: Mai 2008
Lieu: Sydney, Australie
Messages: 1009
Où avez-vous besoin d'afficher les marques de caractère? Dans une session de terminal AIX quelconque? Ou dans une application ou un client qui se connecte au serveur? Ou sur un autre système que les données seront transférées à?
  #6 (permalink)  
Old 09-02-2008
ère era is offline Forum Advisor  
Inutile de Herder Cats (en congé sabbatique)
  
 

Join Date: Mar 2008
Location: / il / est / que / bin / sh
Messages: 3652
La grande question qui est en jeu de caractères que vous voyez la marque signer, ou, ce qui ISO-8859-1 caractères voyez-vous comme un SUB caractère (quel qu'il soit?)

En ASCII, il est un caractère de contrôle SUB (ctrl-Z) qui ont le caractère de code 26 décimal (032 octal, hex 0x1a) - est que ce que vous avez dans votre dossier? Quel serait un bon encodage de la transférer à d'? Les commandes suivantes permettent de traduire toutes les occurrences de ce code de caractères Unicode dans le signe de marque caractère U 2122 dans l'encodage UTF-8:

Code:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8
Ou dans la norme ISO-8859-1, il est inscrit le signe ® à code 0xAE point, ce serait un bon substitut?

Code:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1
Cela suppose que le personnage est vraiment SUB caractère code 0x1a; si elle ne l'est pas, mais vous pouvez trouver de quoi il s'agit plutôt, il devrait être trivial d'adapter l'un de ces one-liners à quelque chose qui fonctionne pour vous. Certaines pages de code Windows ont le symbole de marque à 0x99 afin que pourrait être une chose à essayer si 0x1a ne fonctionne pas pour vous (mais, là encore, si vous pouvez regarder le brut octets dans le fichier, vous n'avez pas à deviner) .

Dernière édition par époque au 09.02.2008 01:59 AM.. Motif: Ajouter ISO8859-1 ® substitution; remarque sur Windows 0x99 caractères
Closed Thread

Bookmarks

Tags
jeu de caractères, encodage

Thread Tools Recherche sur ce Thread
Recherche sur ce Thread:

Recherche avancée
Modes d'affichage Rate this thread
Rate this thread:

Règles de messages
Tu mai pas de nouvelles discussions: nonoui
Tu mai pas envoyer des réponses:
Tu mai pas envoyer des pièces jointes
Tu mai pas modifier vos messages

BB code est Sur
Smilies sont Sur
[IMG] code est Sur
Le code HTML est Hors tension
Trackbacks sont Sur
Pingbacks sont Sur
Refbacks sont Sur




Toutes les heures sont au format GMT -4. Le temps est maintenant 11:24 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traductions Langue Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
Les systèmes UNIX et Linux Forums Content Copyright © 1993-2009. Tous droits Reserved.Ad de gestion par RedTyger

Content Relevant URLs par vBSEO 3.2.0