|
Mesclando arquivos com Awk filtragem e contagem linhas
Oi lá,
Tenho um casal de arquivos eu preciso para a fusão. Eu posso fazer uma simples junção de concatenar-los em um arquivo maior.
Mas então eu preciso filtrar os arquivos para obter um resultado desejado.
A saída parecido com isto:
Código:
TRNH 0000000010941
ORDH
OADR
OADR
ORDL
ENDT 1116399 000000003 000000001
TRLR 0000000010941 000000003 000000001
TRNH 0000000010942
ORDH
OADR
OADR
ORDL
ENDT 1116400 000000003 000000001
TRLR 0000000010942 000000003 000000001
TRNH 0000000010943
ORDH
OADR
OMSG
ORDL
ORDL
ENDT 1116399 000000004 000000001
TRLR 0000000010943 000000003 000000001
TRNH 0000000010944
ORDH
OADR
OADR
ORDL
ENDT 1116400 000000003 000000001
ORDH
OADR
OADR
ORDL
ORDL
ENDT 1116400 000000004 000000001
TRLR 0000000010944 000000007 000000002
a filtragem e deve deixar a primeira ea última linha com o TRNH e TRLR (dando a última TRLR a mesma seqüência como o primeiro TRNH). O resto do TRNH e TRLR linhas devem ser omitidos.
Então o final TRLR deveria representar a quantidade de linhas e ORDH a quantidade de OADR, OMSG e ORDL linhas.
Eu não tenham chegado a apagar as linhas extras TRNH e TRLR ainda, que é o filtro que tenho até agora:
Código:
BEGIN {
# define two counters
ordh_cnt = 0;
ordl_total_cnt = 0;
}
# Start filter
# if line start with ORDH add 1 to counters
$1 == "ORDH" {
ordh_cnt++;
}
# if line starts with TRLR, adjust line to reflect new count of ORDH in order
$1 == "TRLR" {
printf "%s%9.9d%s\n", substr($0, 0, 31), ordh_cnt, substr($0, 39);
# line has been printed, next rule
next;
}
# if line start with ORDL add 1 to counters
$1 == "ORDL" {
ordl_total_cnt++;
}
# if line start with OADR add 1 to counters
$1 == "OADR" {
ordl_total_cnt++;
}
# if line start with OMSG add 1 to counters
$1 == "OMSG" {
ordl_total_cnt++;
}
# if line starts with TRLR, adjust line to reflect new total ORDL, OADR and OMSG in complete file
$1 == "TRLR" {
printf "%s%9.9d%s\n", substr($0, 0, 19), ordl_total_cnt, substr($0, 29);
# line has been printed, next rule
next;
}
# Line has not changed, print normal line
{
print $0;
}
Agora, a quantidade de linhas ORDH é saída para o meu novo arquivo, de modo que parece funcionar. No entanto, o montante de OADR, OMSG e ORDL linhas não é corrigido na saída.
O resultado final deverá ser parecido com isto:
Código:
TRNH 0000000010941
ORDH
OADR
OADR
ORDL
ENDT 1116399 000000003 000000001
ORDH
OADR
OADR
ORDL
ENDT 1116400 000000003 000000001
ORDH
OADR
OMSG
ORDL
ORDL
ENDT 1116399 000000004 000000001
ORDH
OADR
OADR
ORDL
ENDT 1116400 000000003 000000001
ORDH
OADR
OADR
ORDL
ORDL
ENDT 1116400 000000004 000000001
TRLR 0000000010941 000000017 000000005
Qualquer ajuda seria muito apreciada
|