![]() |
|
|
Google unix.com
|
|||||||
| Форумы | Регистрация | Правила форума | Ссылки | Альбомы | ЧАВО | Список участников | Календарь | Поиск | Сегодняшние сообщения | Отметить форумы читать |
| Shell программирование и сценарии Почтовые вопросы о KSH, CSH, SH, BASH, Perl, PHP, SED, AWK и скрипты оболочки и оболочки скриптовых языков здесь. |
Подробнее UNIX и Linux Темы форума можно найти полезные
|
||||
| Нить | Резьба для начинающих | Форум | Ответы | Последнее сообщение |
| Удаление дубликатов из файла с конкретного места | gopikgunda | Shell программирование и сценарии | 1 | 04-09-2008 03:16 AM |
| Самый быстрый путь для поиска файлов | vaibhavbhat | UNIX перспективных И опытных пользователей | 3 | 03-10-2008 10:57 AM |
| Как удалить дубликаты без сортировки | orahi001 | UNIX для чайников Вопросы И Ответы | 4 | 01-17-2008 07:19 PM |
| Как удалить / удалить каталог в быстрый способ | getdpg | Shell программирование и сценарии | 6 | 03-07-2006 10:42 AM |
| быстро скопировать команду | vascobrito | UNIX для чайников Вопросы И Ответы | 0 | 07-20-2004 07:02 AM |
![]() |
|
|
LinkBack | Резьба Инструменты | Искать в этом Thread | Оценить Thread | Режимы дисплея |
|
|
|
||||
|
быстрый способ удаления дубликатов.
Я искал на часто задаваемые вопросы - с помощью сортировки, дубликатов и т.д. ... но я не получил каких-либо статей или результаты по нему.
В настоящее время я использую: Сорт-U file1> file2 для удаления дубликатов. Для файла размером около 1giga байт. Время, необходимое для удаления дубликатов это 1 час 21 мин. Есть ли какие-либо другие быстрый способ удаления дубликатов? Наши размеры файлов может получить от 10 до 12 гига байт размера. Aprpeciate каких-либо указателей. Спасибо, Радхики. |
|
||||
|
Это около 200Кб / с Pretty дерьма.
Полагаю, вы обмолот своп? Одна вещь, чтобы проверить это, если вам не нужна многобайтовых сортировка, Затем переменной рода команду LANG \u003d C Похоже, вам потребуется база данных (индекс), которые будут честными. Если вывод является небольшой% от вклада, а затем прямо перегородки входные будет полезным. IE: в то время как сорт-U кусок | сорт-U |
|
||||
|
Попробуйте это ...
SED '$! N; / ^ \ (.* \) \ N \ 1 $ /! P; D' # Первая строка дублировать те только хранятся и остальные будут удалены. Я испытал это около 1GB файл. Он принял около 13 минут, что для сортировки файлов. Многое гораздо быстрее, чем сортировка команды. ![]() Последний раз редактировалось amit_sapre; на 06-24-2005 10:53 AM.. |
|
||||
|
Привет Vino,
Эта команда будет первой позиции, как это и исключить другие записи, независимо от того, файл отсортирован или нет. Не ранее предположения при выполнении этой команды. |
|
||||
|
Привет Амит,
>> SED '$! N; / ^ \ (.* \) \ N \ 1 $ /! P; D' Не могли бы вы объяснить, в команде - постепенно, если вы не возражаете. Спасибо! |
![]() |
| Закладки |
| Резьба Инструменты | Искать в этом Thread |
| Режимы дисплея | Оценить эту ветку |
|
|