8-(927)-977-80-70 web-i-seo@yandex.ru
Режим работы: 10-00 до 20-00 МСК

Вы нашли нас по запросу -"Сравнение методов объединения двух отсортированных списков в Python Донской" - это лучшая рекомендация для подрядчика SEO продвижения в городе Донской или по России!

Сравнение методов объединения двух отсортированных списков в Python

Пусть у нас есть два списка (для простоты из целых чисел), каждый из которых отсортирован. Хотим объединить их в один список, который тоже должен быть отсортирован. Эта задача наверняка всем знакома, используется, например, при сортировке слиянием.

 

 

Способов реализации (особенно на python) достаточно много. Давайте разберем некоторые из них и сравним затрачиваемое время на разных входных данных.

Основная идея алгоритма заключается в том, что, поместив по одной метке в начале каждого списка, будем сравнивать отмеченные элементы, брать меньший из них и передвигать метку в его списке на следующее число. Когда один из списков кончается, нужно добавить остаток второго в конец.

 

Входные данные не меняются

Пусть есть два списка list1 и list2.

Начнем с самого простого алгоритма: обозначим метки за i и j и будем брать меньший из list1[i]list2[j] и увеличивать его метку на единицу, пока одна из меток не выйдет за границу списка.

При первом сравнении мы выберем минимальный элемент из двух минимальных в своем списке и подвинемся на следующий элемент, поэтому наименьший элемент из двух списков будет стоять на нулевом месте результирующего. Дальше несложно по индукции доказать, что далее слияние пройдет верно.

Перейдем к коду:

def simple_merge(list1, list2):
    i, j = 0, 0
    res = []
    while i < len(list1) and j < len(list2):
        if list1[i] < list2[j]:
            res.append(list1[i])
            i += 1
        else:
            res.append(list2[j])
            j += 1
    res += list1[i:]
    res += list2[j:] 
    # один из list1[i:] и list2[j:] будет уже пустой, поэтому добавится только нужный остаток
    return res

 

Заметим, что в данном коде используется только перемещение вперед по списку. Поэтому будет достаточно работать с итераторами. Перепишем алгоритм с помощью итераторов.

 

Еще изменим обработку концов списков, так как теперь мы не умеем копировать сразу до конца. Будем обрабатывать элементы до того, когда оба итератора дойдут до конца, при этом, если один уже оказался в конце, будем просто брать из второго.

 

def iter_merge(list1, list2):
    result, it1, it2 = [], iter(list1), iter(list2)
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            result.append(el2)
            el2 = next(it2, None)
        else:
            result.append(el1)
            el1 = next(it1, None)
    return result

 

В этой реализации можно вместо добавления по одному элементу (result.append()) собрать генератор, а потом из него получить список. Для этого напишем отдельную функцию, которая будет строить генератор, а основная функция сделает из него список.

 

def gen_merge_inner(it1, it2):
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            yield el2
            el2 = next(it2, None)
        else:
            yield el1
            el1 = next(it1, None)

def gen_merge(list1, list2):
    return list(gen_merge_inner(iter(list1), iter(list2))) # из генератора получаем список

 

Встроенные реализации

Рассмотрим еще несколько способов слияния через встроенные в python функции.

  • merge из heapq. Как говорит документация, эта функция делает именно то, что мы хотим, и больше: объединяет несколько итерируемых объекта, можно задать ключ, можно сортировать в обратном порядке.
    Тогда нам нужно просто импортировать и использовать:

    from heapq import merge
    
    def heapq_merge(list1, list2):
        return list(merge(list1, list2)) # тоже возвращает генератор
  • Counter из collectionsCounter умеет считать количество вхождений каждого из элементов, выдавать их в тех количествах, в которых они входят, и еще несколько полезных вещей, которые сейчас не нужны (например, несколько самых часто встречающихся элементов).
    Воспользуемся gen_merge_inner для слияния элементов Counter(list1) и Counter(list2):

    def counter_merge(list1, list2):
        return list(gen_merge_inner(Counter(list1).elements(), Counter(list2).elements()))
  • И, наконец, просто сортировка. Объединяем и сортируем заново. Тут есть два варианта реализация через sort() и sorted(). Сразу сравним их:
list1 = [i for i in range(1, 200000, 3)]
list2 = [i for i in range(2, 250000, 4)]
%timeit res1 = sorted(list1 + list2)
%timeit res2 = list1 + list2; res2.sort()
6.73 ms ± 64.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.43 ms ± 38.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

В результате:

    def sort_merge(list1, list2):
        return (list1 + list2).sort()

Если можно менять исходные списки

 

Предположим, что после слияния старые списки больше не нужны (как обычно и случается). Тогда можно написать еще один способ. Будем как и раньше сравнивать нулевые элементы списков и вызывать pop(0) у списка с меньшим, пока один из списков не закончится.

 

def pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[0] < list2[0] else list2).pop(0))
    return result + list1 + list2

 

Получили простенькую функцию на 4 строчки, но использовать дальше исходные списки не получится. Можно их скопировать, потом работать с копиями, но это потребует много дополнительного времени. Здесь будут проблемы с тем, что удаление нулевого элемента очень дорогое. Поэтому еще одна модификация будет заключаться в том, что мы будем вместо удаления из начала списка использовать удаление из конца, но придется в конце развернуть списки.

 

def reverse_pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[-1] > list2[-1] else list2).pop(-1))
    return (result + list1[-1::-1] + list2[-1::-1])[-1::-1]

 

Сравнение

 

Пора перейти к самому интересному.
Составим список функций, которые будем сравнивать:

 

  • simple_merge
  • iter_merge
  • gen_merge
  • heapq_merge
  • counter_merge
  • sort_merge
  • pop_merge
  • reverse_pop_merge

 

Будем измерять время работы с помощью модуля timeit. Код можно посмотреть здесь.

 

Разберем несколько ситуаций: оба списка примерно одинакового размера, один список большой, а второй маленький, количество вариантов элементов большое, количество вариантов маленькое. Кроме этого проведем просто общий случайный тест.

Тест первый

 

Проведем общий тест, размеры от $1$ до $10^5$, элементы от $1$ до $10^6$.

 

Отдельно сравним pop и reverse_pop:

 

 

pop_merge тратит колоссально больше времени в общем случае, как и ожидалось.

 

Не будем учитывать здесь огромный pop_merge, чтобы лучше видеть разницу между другими:

 

 

reverse_pop_merge показал себя относительно неплохо по сравнению с ручной реализацией и heapq_merge.

 

Методы на итераторах работают еще быстрее, при этом видно, что получилось выгоднее построить генератор, чем добавлять элементы в список.

 

Тест второй, сравнимые размеры

 

Размеры будут принадлежать отрезку $[50x, 50(x+1))$, а $x$ увеличиваем, начиная с $1$. Шаг $50$.

 

 

Как уже можно видеть pop_merge при небольшом размере списков еще ведет себя как heapq_merge, а дальше обгоняет всех.

 

Тест третий, один маленький, второй большой

 

Размер первого равен $x$, размер второго $10^4 + 100x$.

 

 

В самом начале (на очень маленьких списках) reverse_pop_merge обгоняет всех, кроме sort_merge, но на чуть больших все выходит на стандартные позиции.

 

Тест четвертый, много повторных

 

Размеры фиксированы, а количество элементов увеличивается на $5$, начиная с $1$.

 

 

Как видно, на достаточно малых количествах counter_merge оказывается быстрее reverse_pop_merge и heapq_merge, но потом он отстает.

 

Чемпионы

Абсолютным победителем оказался sort_merge! Гораздо быстрее просто отсортировать список заново, чем использовать вроде бы линейные от длины списков функции.

На втором месте в подавляющем большинстве случаев идет gen_merge, за ним следует iter_merge.

Остальные методы используют еще больше времени, но некоторые в каких-то крайних случаях достигают результатов 2-3 мест.

Дата изменения


Индивидуальный Предприниматель Ознобин Р.А.
8-927-977-80-70
Адрес: г. Донской, ул. Строителей, строение 12

Полезная информация по теме - Сравнение методов объединения двух отсортированных списков в Python Донской

Ознобин Роман Александрович Донской

директор ООО «Код Эксперт — РМ», управляющий партнёр ООО «Код Эксперт», CEO, руководитель порталов ; «Позади более 100 сайтов и WEB приложений, десятки организаций и Servers, внедрений и разработок. Но более всего я горжусь победой на конкурсе инновационных порталов Министерства Экономики и Технологий Германии в Гановере, где разрабатываемые нами технологии оптимизации для Linux Os показали реальное ускорение вычислительных процессов с использованием больших массивов данных на 12%!!! А так же благодарностью людей доверивших нам свои заботы и надежды.»  С наилучшими пожеланиями, Ознобин Роман Награды: Призёр (3-е место) на конкурсе инновационных порталов Министерства экономики и технологий Федеративной Республики Германия. Гановер. 10.11.2011 Победитель конкурса Лучший предприниматель Республики Мордовия 2013 года в номинации «Эффективные инновации и новые технологии в малом и среднем бизнесе». Как член команды ООО «Код – Эксперт» в должности...

Скрыть товары онлайн магазина без артикля. Донской

В процессе интеграции онлайн магазина на WordPress и 1С:УНФ, возникла необходимость скрыть товары без артикля (накопившееся в базе данных и не торгуемых в настоящий момент). Запрошено. Сделано! Задача решается добавлением в файл functions.php следующего кода: // Удаляем из запроса товаров, товары без артикля add_action( 'woocommerce_product_query', 'no_sku_pre_get_posts_query' ); function no_sku_pre_get_posts_query( $query ) { $query->set( 'meta_query', array( array( 'key' => '_sku', 'value' => '', 'compare' => '!=' ))); } Таким образом мы перехватываем формирующееся обращение к БД сайта, и добавляем условие не равенства артикля (_sku) пустой строке. ; ...

продвижение интернет магазина Донской

Возможно, Вы уже знаете, что создание on-line магазина Донской в качестве витрины для ваших товаров или усилий — это только первый шаг к тому, чтобы магазин начал работать на вас. Какую ценность имеет веб-сайт, если ваш целевой рынок и потенциальные клиенты не знают о его существовании? Сравнение методов объединения двух отсортированных списков в Python — получи СКИДКУ 10% На самом деле очень мало. Если вы владелец on-line магазина или хотите заказать раскрутка on-line магазин Донской, мы предоставим Вам сервис по раскрутки информации в сети. любой on-line магазин требует раскрутка в web сети, иначе его не смогут найти Ваши потенциальные и новые покупатели. Цель сервис «раскрутка on-line магазин Донской» — занять наилучшую позицию в результате поиска по ключевым запросам связанным с Вашим бизнесом. в наш кейс раскрутка on-line магазина Донской входит комплекс...

Сайт производителя ЖБИ Донской

Создан сайт ООО «ПК ЖБИ МАРК». ООО «ПК ЖБИ МАРК» производство — ЖБИ. В состав компании входит  завод ЖБИ, производственные мощности которого позволяют обеспечить железобетонными изделиями строительство любых объектов. Завод ООО «ПК ЖБИ МАРК» расположен в г. Москве, это позволяет заказчику осуществлять доставку и по городу, и по области с минимальными затратами, что значительно снижает конечную стоимость ЖБИ для потребителей. Современное производство, контроль качества, строгое выполнение договорных обязательств — основные критерии деятельности организации. Сайт разработан с использованием СМS Joomla. Посмотреть сайт заказчика … ...

seo продвижение сайтов Донской

раскрутка сайтов в Донской для начинающего и уже действующего дела играют ключевую роль в успехе и развитии.  Предлагая реальную ценность, товары и сервис для ваших клиентов, вам выгодно быстро и эффективно доносить данные до целевой аудитории, которая может стать вашими покупателями через поиск в сети on-line. Сравнение методов объединения двух отсортированных списков в Python — получи СКИДКУ 10% ИП Ознобин Р.А. имеет 15 летний опыт в создании и оптимизации web сети порталов, обеспечивая качественный результат не зависимо от того является ли ваш бизнес региональным, национальным или международным. Наша компания постоянно достигает коммерческих целей наших клиентов, генерируя реальные продажи по доступным условиям. Мы предлагаем разработать план по оптимизации Вашего портала Донской и превратить его в реальность по всем стандартам разработки W3C (World Wide Web Consortium) и следуя...

Рассылка почты по Вашим и Наши базам Донской

Только для партнёров ! (не занимаемся спамом на заказ !) Только нашим партнёрам по другим порталам, как маркетинговую поддержку Ваших сайтов и дела, мы предлагаем Вам организацию почтовой рассылки Ваших новостей и предложений, по Вашим адресным базам и по набору наших баз. Рассылка «новости» по Вашей базе адресов — 0,25 рубля за штуку (минимальная сумма 1500 руб.) Рассылка «новости» по нашим базам данных (сгруппированы по роду занятий) — 1 рубль за адрес. Наши рассылки отличаются — Высокая степень прохождения спам фильтров, Статистика по открытию и переходам Ответы на Вашу почту, спам и ответы Servers на техническую Группирование адресатов по роду занятий Есть возможность внедрить в Ваш сайт редактор почтовых рассылок, и Вы сможете отсылать новости по Вашим клиентам совершенно бесплатно, когда захотите. ...

Качественное сравнение методов сортировки Донской

Сортировка — часто встречается в работе разработчика. В то же время это высоко нагруженный процесс, который может существенно повлиять на скорость всего приложения. Потому исследуем вопрос алгоритмов сортировки на Python, рассмотрим наиболее известные варианты и определимся с наиболее быстрым из них. В добрый путь… Математические Параметры алгоритмов: Временная сложность: определяется как функция от длины строки, представляющей входные данные, равная времени усилия алгоритма на данном входе. Характеризует ожидаемое общее тактовое время (ОТВ), где такт это одна операция. Прямо влияет на Время исполнения, однако ОТВ и реальные временные затраты не совсем одно и тоже. Временная сложность отражает количество операций, но для разных алгоритмов скорость выполнения операций разное, в результате скорость алгоритмов с одной и той же временной сложностью, могут существенно отличаться. Пространство сложности: работает аналогично временной сложности. Характеризует — объёмы...

Лучший инновационный предприниматель 2013 года в Мордовии! Донской

ООО «Код Эксперт», а с ней и ООО «Код Экперт — РМ» стала победителем конкурса   Министерства Торговли и Промышленности Республики Мордовия «Лудший предприниматель 2013 года» в номинации «инновации и эффективные технологии». Министр Владимир Викторович Руженков отметил, что «Код Эксперт» является одним из «птенцов» «ГКУ «Бизнес – инкубатор Республики Мордовия»,  который «вылетел» из его «гнезда» и превратился в состоявшуюся и востребованную инновационную компанию. Данное признание со стороны министерства и правительства в целом, мы получили за успешную установку и внедрение Серверной платформы СП «Прометей». СП «Прометей» комплекс на основе Linux CentOs и пакета собственных программных разработок ООО «Код — эксперт». Данный комплекс позволяет в 90% случаев эффективно замещать аналогичный по свойствам Windows Server 2012, при значительно меньшей цене. И всю выручку оставлять на территории Мордовии и РФ. В...