![]() |
Bonjour et bienvenu par les États-Unis à la UNIX et Linux Forums! Merci de votre visite et vous joindre à notre communauté mondiale.
|
|
google unix.com
|
|||||||
| Forums | S'inscrire | Forum Rules | Liens | Albums | FAQ | Liste des membres | Calendrier | Recherche | Aujourd'hui, les postes | Marquer les forums comme lus |
| UNIX for Advanced & Expert Users Expert à Expert. Apprenez avancé UNIX, des commandes UNIX, Linux, les systèmes d'exploitation, d'administration système, de la Programmation, Shell, Shell Scripts, Solaris, Linux, HP-UX, AIX, OS X, BSD. |
Plus d'UNIX et Linux Forum Sujets Vous trouverez peut-être utile
|
||||
| Fil | Thread Starter | Forum | Réponses | Last Post |
| Extrait du dernier caractère de la chaîne | Annelisa | De programmation et de script Shell | 8 | 07-04-2008 11:57 PM |
| Comment faire pour extraire la première colonne avec un caractère spécifique | selamba_warrior | De programmation et de script Shell | 3 | 05-22-2008 05:14 AM |
| extrait de caractère + 1 | francis_tom | De programmation et de script Shell | 1 | 04-21-2008 12:16 PM |
| grep ou awk problème, l'incapacité d'extraire les numéros | Baghera | De programmation et de script Shell | 7 | 08-31-2007 04:42 PM |
| Extrait d'un personnage | aajan | UNIX for Advanced & Expert Users | 10 | 08-20-2007 10:03 AM |
![]() |
|
|
LinkBack | Thread Tools | Recherche sur ce Thread | Rate Thread | Modes d'affichage |
|
|
|
||||
|
incapable d'en extraire des marques (™) de caractères
Bonjour tous,
Je suis en train d'extraire un caractère de marque (™) d'une colonne dans un varchar DB2 Table. Le résultat doit être placé dans un fichier séquentiel dans un environnement AIX. Après l'extraction est terminée lorsque je visualiser le fichier, j'ai remarqué que, dans le lieu de la (™) d'un autre personnage mis en évidence le caractère SUB a été placé. Ce serait génial si quelqu'un peut nous éclairer sur les raisons pour lesquelles il n'affiche pas le (™) de caractères. Serait-ce parce que le jeu de caractères AIX ne permet pas ce caractère? Voulez-vous remercions de vos conseils. Merci |
|
||||
|
Oui. Toutefois, si vous étiez à la charge le fichier de sortie dans un environnement similaire à celui où vous étiez en train de consulter les données d'abord, vous devez encore voir le caractère TM, au niveau binaire, il devrait rester inchangé.
|
|
||||
|
Il n'y a pas de telle chose comme un "jeu de caractères AIX». Il existe des octets du fichier, et il est de votre terminal, et il existe plusieurs conventions pour la manière d'afficher les octets dans le fichier sur un terminal. Si vous connaissez le jeu de caractères d'encodage du fichier, et le répertoire de caractères de votre terminal, vous pouvez prédire comment toute la séquence d'octets sera affiché, mais si l'un ou l'autre est inconnu, il est très difficile de dire ce que vous devriez vous attendre ( ou même d'ailleurs de quoi vous parlez).
Plain 7-bit de données est généralement affiché comme ASCII, ce qui est bien défini, mais le (tm) caractère ne fait pas partie de la 7-bit ASCII character set, vous êtes apparemment le fichier affichés dans le cadre de deux interprétations différentes de la nature - codage dans le fichier, en utilisant peut-être deux terminaux, ou les différents outils qui imposent des différentes hypothèses. (Sur AIX peut-être vous avez la possibilité d'ajouter EBCDIC en le mélange, mais cela ne doit pas y aller.) Quoi qu'il en soit, pour résoudre ce problème, vous voudrez peut-être utiliser un outil de dump hex (od, xxd, hexdump, Ou même seulement cat-A) À examiner ce que les octets du fichier. Une fois que vous le savez, il ne devrait pas être difficile de déterminer l'encodage qui donne l'interprétation que vous souhaitez, et / ou de convertir le fichier de la représentation que vous voulez. |
|
||||
|
Merci pour la réponse .. J'ai trouvé que le codage de caractères utilisé est ISO8859-1 et ne disposent pas des marques signer. Les marques de caractères est un mot réservé, et affiché comme SUB.
Est-il possible de convertir le fichier à l'autre avec des fichiers avec un encodage de caractères et être en mesure d'afficher les marques de caractère? Si oui, comment pourrait-il être fait par unix? Merci |
|
||||
|
Où avez-vous besoin d'afficher les marques de caractère? Dans une session de terminal AIX quelconque? Ou dans une application ou un client qui se connecte au serveur? Ou sur un autre système que les données seront transférées à ?
|
|
||||
|
La grande question qui est en jeu de caractères que vous voyez la marque signer, ou, ce qui ISO-8859-1 caractères voyez-vous comme un SUB caractère (quel qu'il soit?)
En ASCII, il est un caractère de contrôle SUB (ctrl-Z) qui ont le caractère de code 26 décimal (032 octal, hex 0x1a) - est que ce que vous avez dans votre dossier? Quel serait un bon encodage de la transférer à d'? Les commandes suivantes permettent de traduire toutes les occurrences de ce code de caractères Unicode dans le signe de marque caractère U 2122 dans l'encodage UTF-8: Code:
perl -pe 's/\x1A/\xE2\x84\xA2/g' file.orig > file.utf8 Code:
perl -pe 's/\x1A/\xAE/g' file.orig > file.iso-8859-1 Dernière édition par époque au 09.02.2008 01:59 AM.. Motif: Ajouter ISO8859-1 ® substitution; remarque sur Windows 0x99 caractères |
![]() |
| Bookmarks |
| Tags |
| jeu de caractères, encodage |
| Thread Tools | Recherche sur ce Thread |
| Modes d'affichage | Rate this thread |
|
|