Removing duplicate terms in a file

11-08-2012

Registered User

15, 0

Join Date: Oct 2012

Last Activity: 3 December 2012, 11:36 AM EST

Posts: 15

Thanks Given: 14

Thanked 0 Times in 0 Posts

Removing duplicate terms in a file

Hi everybody
I have a .txt file that contains some assembly code for optimizing it i need to remove some replicated parts.
for example I have:

Code:

e_li r0,-1 
e_li r25,-1  
e_lis r25,0000  
 
add r31, r31 ,r0 
       
e_li r28,-1  
e_lis r28,0000  
 
add r31, r31 ,r0 
       
e_li r28,-1  
e_lis r28,0000  
 
add r31, r31 ,r0 
       
e_li r2,-1  
e_lis r2,0000  
 
add r31, r31 ,r0 
       
e_li r9,-1  
e_lis r9,0000  
 
add r31, r31 ,r0 
       
e_li r24,-1  
e_lis r24,0000  
 
add r31, r31 ,r0 
       
e_li r21,-1  
e_lis r21,0000  
 
add r31, r31 ,r0 
       
e_li r28,-1  
e_lis r28,0000  
 
add r31, r31 ,r0

So if in a way I could remove the replicated parts the final code would look like:

Code:

e_li r0,-1 
e_li r25,-1  
e_lis r25,0000  
 
add r31, r31 ,r0 
       
e_li r28,-1  
e_lis r28,0000  
 
add r31, r31 ,r0 
              
e_li r2,-1  
e_lis r2,0000  
 
add r31, r31 ,r0 
       
e_li r9,-1  
e_lis r9,0000  
 
add r31, r31 ,r0 
       
e_li r24,-1  
e_lis r24,0000  
 
add r31, r31 ,r0 
       
e_li r21,-1  
e_lis r21,0000  
 
add r31, r31 ,r0

Thanks for your help

Behrouzx77

View Public Profile for Behrouzx77

Find all posts by Behrouzx77

11-08-2012

Read Only

1,278, 486

Join Date: Sep 2012

Last Activity: 27 February 2020, 8:59 PM EST

Location: Houston, Texas, USA

Posts: 1,278

Thanks Given: 0

Thanked 486 Times in 451 Posts

try:

Code:

awk '
{sub(" *$",""); sub("^ *",""); l=l":"$0; }
/add/ {if (b[l]) {l=""; next;} else {a[c++]=l; b[l]=l;};l=""}
END {
  for (i=0; i<c; i++) {
    sub("^:", "", a[i]);
    gsub(":", "\n", a[i]);
    printf a[i];
    print "";
  }
}
' a.txt

This User Gave Thanks to rdrtx1 For This Post:

rdrtx1

View Public Profile for rdrtx1

Find all posts by rdrtx1

11-09-2012

Registered User

15, 0

Join Date: Oct 2012

Last Activity: 3 December 2012, 11:36 AM EST

Posts: 15

Thanks Given: 14

Thanked 0 Times in 0 Posts

Thanks rdrtx1, seems work!

Behrouzx77

View Public Profile for Behrouzx77

Find all posts by Behrouzx77

11-09-2012

Moderator

12,296, 3,792

Join Date: Nov 2008

Last Activity: 1 January 2021, 1:47 AM EST

Location: Amsterdam

Posts: 12,296

Thanks Given: 679

Thanked 3,792 Times in 3,282 Posts

Alternatively (just for fun):

Code:

awk '{getline p} !A[$0,p]++{print $0 ORS p}' RS= ORS='\n\n' infile

But this is probably not practical, since it would be sensitive to extra spaces in the input file..

Scrutinizer

View Public Profile for Scrutinizer

Find all posts by Scrutinizer

Shell Programming and Scripting

Removing duplicate terms in a file

10 More Discussions You Might Find Interesting

1. Shell Programming and Scripting

Removing duplicate sequences and modifying a text file

Discussion started by: 4galaxy7

2. Shell Programming and Scripting

Removing Duplicate Rows in a file

Discussion started by: ekbaazigar

3. UNIX for Dummies Questions & Answers

Removing a set of Duplicate lines from a file

Discussion started by: raosr020

4. Shell Programming and Scripting

Removing a block of duplicate lines from a file

Discussion started by: raosr020

5. Shell Programming and Scripting

Removing duplicate records in a file based on single column explanation

Discussion started by: cokedude

6. Shell Programming and Scripting

Removing duplicate records in a file based on single column

Discussion started by: G.K.K

7. Shell Programming and Scripting

removing duplicate lines while maintaing coherence with second file

Discussion started by: adrunknarwhal

8. Shell Programming and Scripting

Removing duplicate records from 2 files

Discussion started by: zooby

9. Shell Programming and Scripting

removing the duplicate lines in a file

Discussion started by: Sharmila_P

10. UNIX for Dummies Questions & Answers

removing duplicate lines from a file

Discussion started by: ocelot