The UNIX and Linux Forums  

Go Back   UNIX og Linux Forums > Top Forums > UNIX for dummyer SpørgsmÃ¥l & svar
.
google unix.com



UNIX for dummyer Spørgsmål & svar Hvis du ikke ved, hvor man skal sende en UNIX-eller Linux-spørgsmål, efter det her. Alle UNIX og Linux newbies velkommen!

Mere UNIX og Linux Forum Emner du måske kan finde Helpful
Tråd Thread Starter Forum Svar Last Post
Fjernelse af visse tegn i en fil bombcan Shell Programmering og Scripting 2 04-25-2008 04:53 PM
Erstatter tegn i csv-fil finwhiz UNIX for dummyer Spørgsmål & svar 1 03-31-2008 06:25 AM
Ugyldige tegn i filen. kanu_pathak Shell Programmering og Scripting 5 02-01-2008 09:45 AM
hvordan man kan se specialtegn i en fil ved hjælp VI jingi1234 UNIX for dummyer Spørgsmål & svar 6 10-19-2005 12:57 PM
grepping de første 3 tegn fra en fil Rachael UNIX for dummyer Spørgsmål & svar 2 10-15-2001 03:33 PM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Søg denne tråd Rate Thread Display Modes
  #1 (permalink)  
Old 01-31-2008
kanu_pathak kanu_pathak is offline
Registreret Bruger
  
 

Join Date: Jan 2008
Beliggenhed: Indien
Stillinger: 34
Ugyldige tegn i filen.

Jeg arbejder på AIX. Vi ftp filer til en database. Den flade filer, der har tusinder af optegnelser og hver post er der omkring 50 til 60 tegn (der er områder, der har visse tegn længde). Ud over nogle gyldige ascii tegn nogle ugyldige tegn gerne Å, A, A, A eller rør krybningsfaktoren, hvor datawarehouse afviser at indlæse i.
Eksempel: AcuM-^? En 051706;
ovenfor er et område i det register, der har specialtegn gerne -, ^ og? , Som ikke burde have været der.

The record separator er en ny linje, og der er ingen område SEPERATOR.

Hvordan kan jeg fjerne disse ugyldige eller specialtegn at krybe i bøgerne?
Please hjælp mig med at finde logikken i råtanken sripting ..
  #2 (permalink)  
Old 01-31-2008
Perderabo's Avatar
Perderabo Perderabo is offline Forum Staff  
Unix Daemon
  
 

Join Date: Aug 2001
Beliggenhed: Ashburn, Virginia
Indlæg: 9.131

Code:
$ echo "invalid characters like Å, å, Ä, ä or"
invalid characters like Å, å, Ä, ä or
$ echo "invalid characters like Å, å, Ä, ä or"| tr -dc " a-zA-Z0-9,\n"
invalid characters like , , ,  or
$

  #3 (permalink)  
Old 01-31-2008
kanu_pathak kanu_pathak is offline
Registreret Bruger
  
 

Join Date: Jan 2008
Beliggenhed: Indien
Stillinger: 34
Tak for svaret Perderabo. Der er nogle mere tvivl;

\u003d> Der kan være mange flere ugyldigt tegn som disse, så skal jeg give alle dem i 'som' kommando?

\u003d> Hvis jeg ønsker at erstatte 'ugyldigt tegn "med et" rum "hvordan kan jeg det?

\u003d> Hvordan skal køre hele processen for tusindvis af records i filen?

Vedhæftet er et eksempel i denne forbindelse ...
Vedhæftede filer
File Type: txt Example.txt (1,4 KB, 39 visninger)
  #4 (permalink)  
Old 01-31-2008
Perderabo's Avatar
Perderabo Perderabo is offline Forum Staff  
Unix Daemon
  
 

Join Date: Aug 2001
Beliggenhed: Ashburn, Virginia
Indlæg: 9.131
Den
echo "ugyldige tegn gerne Ã…, A, A, A eller"
leverer input data med ulovlige tegn, der kræver fjernelse. Jeg har brug for nogle test data, og dette er en måde at demo en kommando. Og kommandoen jeg viser, er
tr-dc "a-zA-Z0-9, \ n"
og det er det, fjerner skraldet. Den tr kommando, i denne form, opregner de gyldige tegn, ikke ugyldig dem. Du kan være nødt til at tilføje ting til listen. At erstatte ugyldige tegn med et mellemrum brug
Code:
$ echo "invalid characters like Å, å, Ä, ä or"| tr -c ' a-zA-Z0-9,\n'  ' '
invalid characters like  ,  ,  ,   or
$

Jeg har skiftet til enkelt citater, som kan være bedre, hvis du har brug for visse specialtegn, der skal accepteres. I dit tilfælde vil du måske bare gøre
Code:
tr -c ' a-zA-Z0-9,\n'  ' ' < inputfile > outputfile

Læs tr mand side for mere info.
  #5 (permalink)  
Old 02-01-2008
kanu_pathak kanu_pathak is offline
Registreret Bruger
  
 

Join Date: Jan 2008
Beliggenhed: Indien
Stillinger: 34
Question

Jeg brugte den oversætter kommandoer som følger:


1) tr-c-a-zA-Z0-9, \ n "" <inddatafilen> uddatafil \u003d\u003d> Nr. resultat

2) TR-c '[: print:] [: cntrl:] »' <inddatafilen> uddatafil \u003d\u003d>

Den anden kommando erstattet en af de ugyldige tegn med mellemrum, men beholdt alle andre. Da jeg igen kørte kommandoen på resulteret fil, komplette filer. (Input og output.)

Fortæl mig nogle andre kombinationer.

\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d \u003d
Blandt de følgende tegn, ~ æ £ CA, Ç blev erstattet.
\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d\u003d \u003d

Thanks in advance.
Kanu
  #6 (permalink)  
Old 02-01-2008
kanu_pathak kanu_pathak is offline
Registreret Bruger
  
 

Join Date: Jan 2008
Beliggenhed: Indien
Stillinger: 34
Det er "Udskriv". I dont know, hvorfor dette humørikon (ugyldige tegn i mit liv?) Kom op.

Tak
Closed Thread

Bogmærker

Thread Tools Søg denne tråd
Søg denne tråd:

Avanceret søgning
Display Modes Bedøm denne tråd
Bedøm denne tråd:

Udstationering Regler
Du kan ikke post nye tråde
Du kan ikke post svar
Du kan ikke post vedhæftede filer
Du kan ikke redigere dine indlæg

BB-kode er PÃ¥
Smilies er PÃ¥
[IMG] koden er PÃ¥
HTML-koden er Slukket
Trackbacks er PÃ¥
Pingbacks er PÃ¥
Refbacks er PÃ¥




Alle tidspunkter er GMT -4. Den tid er nu 02:29 AM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Oversættelser Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX og Linux Forums Content Copyright © 1993-2009. Alle rettigheder Reserved.Ad Management ved RedTyger

Content Relevant webadresser ved vBSEO 3.2.0