していると3Dのホームアーキテクト4剪定したファイルがある< / a >を" />
![]() |
|
|
Googleのunix.com
|
|||||||
| シェルプログラミングとスクリプティング KSH 、 CSH 、 shに、 bashの、はPerl 、 PHPは、削除するsed 、 Awkの、他のシェルスクリプトやシェルスクリプト言語についての質問の投稿はこちら。 |
その他のUNIXおよびLinuxフォーラムトピックは参考にすること
|
||||
| スレッド | スレッドスターター | フォーラム | 返信 | 最後の投稿 |
| どうすればいいだけのHTMLタグをHTMLファイルからテキストを抽出する | los111 | UNIXのダミー質問と回答のため | 4 | 2007年11月28日 04:40午前 |
| テキストには、スペース区切りのファイルの検索 | andyblaylock | UNIXのダミー質問と回答のため | 6 | 2007年11月27日 07:33午後 |
| テキストに'でHTMLデータcoverting c 'に | phani_sree | 高レベルのプログラミング | 3 | 2007年10月18日 11:06午前 |
| カンマ区切りのテキストファイルの解析 | chengwei | シェルプログラミングとスクリプティング | 5 | 2007年2月23日 05:38午前 |
| タブで区切られたデータをループ | ほろ酔い | シェルプログラミングとスクリプティング | 6 | 2006年10月17日 06:44午後 |
![]() |
|
|
LinkBack | スレッドツール | このスレッドを検索 | スレッドを評価 | 表示モード |
|
|
|
||||
|
私は、私はすでにそのようなデータを持っている部分はgrepを剪定したファイルがある:
『 <a 4"> 3Dのホームhref\u003d"MasterDetailResults.asp?textfield\u003da&Application\u003d3Dホーム建築家建築家4 < / a >を< /のTD > <承認/のTD > - 『 <a < / a >を< /のTDホーム建築6"> 3Dのホーム建築家6 href\u003d"MasterDetailResults.asp?textfield\u003da&Application\u003d3d > されていない<承認/のTD > - 『 <aザップへのZap">に変更< / a > < / href\u003d"MasterDetailResults.asp?textfield\u003da&Application\u003dAのTD > <承認/のTD > - を除いては、多くはもっと;-) 私は(つまり、 3Dのホーム建築4 )は、ステータスは、アプリケーション名を取得する(または未承認承認)つまり、この作品に作り変える:したい 3Dのホーム建築4 |承認 3Dのホーム建築家6 |未承認 のザップ|承認 等 検索データベースやExcelにインポートとして使用するために 私はbashスクリプトを使用する セッド または気の利かない線の最小の数の行(番号これを行うには、もちろん重要ではありません;-) お客様のご協力に感謝する。 |
|
||||
|
引用:
コード:
awk -F"\"" '
/Application=/{
sub(".*=","",$2); s=$2
getline; sub(" <.*","")
print s "|" $0
}' file
|
|
||||
|
すべてのソリューションをご利用いただきありがとうございます。私クリストフシュポアのため、私はもっと快適に使用するつもりだよ セッド awkは私よりも(とはいえ、私は非常に強力なの)知っている。理由は、行の先頭にスペースが私は、パイプの後にスペースが出力されます。どうすれば変更することができます コード:
sed -n '/Application/{N;s/.*Application=\([^"]*\).*\n\(.*\)<.*/\1 | \2/p}' file
これらのスペースを除去する。 また、私の入力ファイルに問題の2行の間に別の行をしています: コード:
<tr>
<td height="23" align="default" valign="top">
<a href="MasterDetailResults.asp?textfield=a&Application=3D Home Architect 4">3D Home Architect 4</a> </td>
<td align="default" valign="top">
Approved </td>
</tr>
再び、私が必要:アプリケーション名|状況私の出力として。私は削除されている align\u003d"default" <td valign\u003d"top"> 行で セッド と仕上げのことをする前に セッド コードをご確認ください。 |
![]() |
| ブックマーク |
| タグ |
| bashの、 csvファイル、 区切り、 HTMLの、 削除するsed awkはbashシェル |
| スレッドツール | このスレッドを検索 |
| 表示モード | このスレッド |
|
|