8-(927)-977-80-70 web-i-seo@yandex.ru
Режим работы: 10-00 до 20-00 МСК

Вы нашли нас по запросу -"Сравнение методов объединения двух отсортированных списков в Python Серов" - это лучшая рекомендация для подрядчика SEO продвижения в городе Серов или по России!

Сравнение методов объединения двух отсортированных списков в Python

Пусть у нас есть два списка (для простоты из целых чисел), каждый из которых отсортирован. Хотим объединить их в один список, который тоже должен быть отсортирован. Эта задача наверняка всем знакома, используется, например, при сортировке слиянием.

 

 

Способов реализации (особенно на python) достаточно много. Давайте разберем некоторые из них и сравним затрачиваемое время на разных входных данных.

Основная идея алгоритма заключается в том, что, поместив по одной метке в начале каждого списка, будем сравнивать отмеченные элементы, брать меньший из них и передвигать метку в его списке на следующее число. Когда один из списков кончается, нужно добавить остаток второго в конец.

 

Входные данные не меняются

Пусть есть два списка list1 и list2.

Начнем с самого простого алгоритма: обозначим метки за i и j и будем брать меньший из list1[i]list2[j] и увеличивать его метку на единицу, пока одна из меток не выйдет за границу списка.

При первом сравнении мы выберем минимальный элемент из двух минимальных в своем списке и подвинемся на следующий элемент, поэтому наименьший элемент из двух списков будет стоять на нулевом месте результирующего. Дальше несложно по индукции доказать, что далее слияние пройдет верно.

Перейдем к коду:

def simple_merge(list1, list2):
    i, j = 0, 0
    res = []
    while i < len(list1) and j < len(list2):
        if list1[i] < list2[j]:
            res.append(list1[i])
            i += 1
        else:
            res.append(list2[j])
            j += 1
    res += list1[i:]
    res += list2[j:] 
    # один из list1[i:] и list2[j:] будет уже пустой, поэтому добавится только нужный остаток
    return res

 

Заметим, что в данном коде используется только перемещение вперед по списку. Поэтому будет достаточно работать с итераторами. Перепишем алгоритм с помощью итераторов.

 

Еще изменим обработку концов списков, так как теперь мы не умеем копировать сразу до конца. Будем обрабатывать элементы до того, когда оба итератора дойдут до конца, при этом, если один уже оказался в конце, будем просто брать из второго.

 

def iter_merge(list1, list2):
    result, it1, it2 = [], iter(list1), iter(list2)
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            result.append(el2)
            el2 = next(it2, None)
        else:
            result.append(el1)
            el1 = next(it1, None)
    return result

 

В этой реализации можно вместо добавления по одному элементу (result.append()) собрать генератор, а потом из него получить список. Для этого напишем отдельную функцию, которая будет строить генератор, а основная функция сделает из него список.

 

def gen_merge_inner(it1, it2):
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            yield el2
            el2 = next(it2, None)
        else:
            yield el1
            el1 = next(it1, None)

def gen_merge(list1, list2):
    return list(gen_merge_inner(iter(list1), iter(list2))) # из генератора получаем список

 

Встроенные реализации

Рассмотрим еще несколько способов слияния через встроенные в python функции.

  • merge из heapq. Как говорит документация, эта функция делает именно то, что мы хотим, и больше: объединяет несколько итерируемых объекта, можно задать ключ, можно сортировать в обратном порядке.
    Тогда нам нужно просто импортировать и использовать:

    from heapq import merge
    
    def heapq_merge(list1, list2):
        return list(merge(list1, list2)) # тоже возвращает генератор
  • Counter из collectionsCounter умеет считать количество вхождений каждого из элементов, выдавать их в тех количествах, в которых они входят, и еще несколько полезных вещей, которые сейчас не нужны (например, несколько самых часто встречающихся элементов).
    Воспользуемся gen_merge_inner для слияния элементов Counter(list1) и Counter(list2):

    def counter_merge(list1, list2):
        return list(gen_merge_inner(Counter(list1).elements(), Counter(list2).elements()))
  • И, наконец, просто сортировка. Объединяем и сортируем заново. Тут есть два варианта реализация через sort() и sorted(). Сразу сравним их:
list1 = [i for i in range(1, 200000, 3)]
list2 = [i for i in range(2, 250000, 4)]
%timeit res1 = sorted(list1 + list2)
%timeit res2 = list1 + list2; res2.sort()
6.73 ms ± 64.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.43 ms ± 38.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

В результате:

    def sort_merge(list1, list2):
        return (list1 + list2).sort()

Если можно менять исходные списки

 

Предположим, что после слияния старые списки больше не нужны (как обычно и случается). Тогда можно написать еще один способ. Будем как и раньше сравнивать нулевые элементы списков и вызывать pop(0) у списка с меньшим, пока один из списков не закончится.

 

def pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[0] < list2[0] else list2).pop(0))
    return result + list1 + list2

 

Получили простенькую функцию на 4 строчки, но использовать дальше исходные списки не получится. Можно их скопировать, потом работать с копиями, но это потребует много дополнительного времени. Здесь будут проблемы с тем, что удаление нулевого элемента очень дорогое. Поэтому еще одна модификация будет заключаться в том, что мы будем вместо удаления из начала списка использовать удаление из конца, но придется в конце развернуть списки.

 

def reverse_pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[-1] > list2[-1] else list2).pop(-1))
    return (result + list1[-1::-1] + list2[-1::-1])[-1::-1]

 

Сравнение

 

Пора перейти к самому интересному.
Составим список функций, которые будем сравнивать:

 

  • simple_merge
  • iter_merge
  • gen_merge
  • heapq_merge
  • counter_merge
  • sort_merge
  • pop_merge
  • reverse_pop_merge

 

Будем измерять время работы с помощью модуля timeit. Код можно посмотреть здесь.

 

Разберем несколько ситуаций: оба списка примерно одинакового размера, один список большой, а второй маленький, количество вариантов элементов большое, количество вариантов маленькое. Кроме этого проведем просто общий случайный тест.

Тест первый

 

Проведем общий тест, размеры от $1$ до $10^5$, элементы от $1$ до $10^6$.

 

Отдельно сравним pop и reverse_pop:

 

 

pop_merge тратит колоссально больше времени в общем случае, как и ожидалось.

 

Не будем учитывать здесь огромный pop_merge, чтобы лучше видеть разницу между другими:

 

 

reverse_pop_merge показал себя относительно неплохо по сравнению с ручной реализацией и heapq_merge.

 

Методы на итераторах работают еще быстрее, при этом видно, что получилось выгоднее построить генератор, чем добавлять элементы в список.

 

Тест второй, сравнимые размеры

 

Размеры будут принадлежать отрезку $[50x, 50(x+1))$, а $x$ увеличиваем, начиная с $1$. Шаг $50$.

 

 

Как уже можно видеть pop_merge при небольшом размере списков еще ведет себя как heapq_merge, а дальше обгоняет всех.

 

Тест третий, один маленький, второй большой

 

Размер первого равен $x$, размер второго $10^4 + 100x$.

 

 

В самом начале (на очень маленьких списках) reverse_pop_merge обгоняет всех, кроме sort_merge, но на чуть больших все выходит на стандартные позиции.

 

Тест четвертый, много повторных

 

Размеры фиксированы, а количество элементов увеличивается на $5$, начиная с $1$.

 

 

Как видно, на достаточно малых количествах counter_merge оказывается быстрее reverse_pop_merge и heapq_merge, но потом он отстает.

 

Чемпионы

Абсолютным победителем оказался sort_merge! Гораздо быстрее просто отсортировать список заново, чем использовать вроде бы линейные от длины списков функции.

На втором месте в подавляющем большинстве случаев идет gen_merge, за ним следует iter_merge.

Остальные методы используют еще больше времени, но некоторые в каких-то крайних случаях достигают результатов 2-3 мест.

Дата изменения


Индивидуальный Предприниматель Ознобин Р.А.
8-927-977-80-70
Адрес: г. Серов, ул. Строителей, строение 12

Полезная информация по теме - Сравнение методов объединения двух отсортированных списков в Python Серов

создание и продвижение сайтов Серов

Закажите создание и раскрутка сайтов Серов прямо сейчас, и увеличите свой доход от продаж. Получите бесплатную консультацию со специалистом по производству и оптимизации сайтов. Давайте поговорим о вашем бизнесе, ваших целях, что вы хотите включить в свой сайт. Наши специалисты знают, как правильно реализовать ваши цели и добиться хорошего результата. Сравнение методов объединения двух отсортированных списков в Python — получи СКИДКУ 10% если вы хотите получить хорошие продажи в web сети, то вам необходимо создать правильный, функциональный и главное удобный для клиентов сайт. создание и раскрутка сайтов Серов для нас в первую очередь это представление Вашего виденья, Вы сами можете определить вариант дизайна и его наполнение, а мы сделаем его красивым, удобным и функциональным. но возникает вопрос кто его будет посещать и смотреть, ведь создание сайтов не дает гарантию что их смогут найти клиенты....

разработка информационного сайта Серов

«Кто владеет информацией — тот владеет миром» сказал Натан Ротшильд более 200 лет назад, сегодня же создание информационного сайта Серов позволяет Вам сделать это! Управляйте, создавайте и распространяйте контентом вместе с нами. Обратитесь к нам сейчас и получите on-line портал в подарок при заказе комплексного адаптации ваших товаров и усилий! Наступила новая эра когда электронные порталы стали вытеснять печатные издания и даже заставили подвинуться на этом рынке телевидение. создание электронной площадки или витрины, позволит Вам стать участником этого рынка и выведет Вас на новый уровень. По мимо новостных порталов Вам может быть интересна создание электронной системы сайт, который удобно, быстро и безопасно позволяет сотрудникам компании обмениваться данными. создание подобного портала актуальна не только для тех кто занимается новостным направлением, но и таким направлениям как  блогосфера , образовательным учреждениям, государственным и т.д. Мы всегда будем рады...

Сайт CLEAN13.ru Серов

Создан сайт производителя бумажных салфеток и туалетной бумаги. ИП Радакин А.В. производит туалетную бумагу и бумажные салфетки под брендом «CLEAN». Осуществляет поставки своей продукции по регионам Центрального Поволжья. Заказчику требовался яркий сайт, с небольшим количеством страниц и информации. Поскольку бизнес стабилен и планировалось лишь актуализация прайс листа компании, цена сайта под ключ составила лишь 16 200 руб.. Для того что бы заказать сайт у нас, вам надо лишь отправить заявку нам на почте с данного сайта или связаться с нами любым из перечисленных в разделе Контакты методов, мы свяжемся с Вами и поможем определится с техническим заданием, дизайном и ценой сайта. ООО «Код Эксперт — РМ» — осуществляет комплексную установку, поддержку и раскрутка сайтов. Посмотреть сайт заказчика … ...

Интернет-мастерская производителя пластиковых окон Серов

Сайт производителя пластиковых окон ООО «Баварские окна» ООО «Баварские окна» крупный производитель и дилер комбинатов пластиковых окон. Так же они оказывают сервис по монтажу оконных систем. Заказчик захотел заказать сайт с большим количеством информации, фото галерей и фото материалов. Это повлияло на цену. По объёму информации данный сайт можно отнести к небольшим корпоративным сайтам. У сайта так же присутствует весь необходимый функционал — размещение новостей, акций компании, актуализация прайс листа компании. сайта составила — 37 400 руб.. Для того что бы заказать сайт у нас, вам надо лишь отправить заявку нам на почте с данного сайта или связаться с нами любым из перечисленных в разделе Контакты методов, мы свяжемся с Вами и поможем определится с техническим заданием, дизайном и ценой сайта. ООО «Код Эксперт — РМ» — осуществляет комплексную установку, поддержку и раскрутка сайтов. Посмотреть сайт заказчика...

Разработчикам и Франчайзе 1С Серов

Здравствуйте. Всех кто трудится на поле внедрения и разработки решений 1С : Платформа 8.2 и выше. Мы приглашаем к сотрудничеству в области замещения серверного ПО Microsoft Windows Server 20xx на серверное решение на основе Серверной платформы «Прометей». Наши сервера и СП «Прометей» основаны на базе ОС Linux CentOs 7, и включают в себя комплекс программ для адаптации и оптимизации усилия Servers с 1С. Наша ценовая политика приятно Вас порадует! И позволит Вам успешно конкурировать по общей цене внедрения в сравнении с конкурентами! Сервера СП «Прометей» показали высокую надёжность и отказоустойчивость, плюс реальное повышение скорости усилия 1С при высоких нагрузках. Сервера СП «Прометей» сертифицированы 1С на совместимость 30 августа 2011 года. В настоящий момент комплекс СП «Прометей» успешно внедрён в 37 предприятиях и организациях Республики Мордовия. В том числе в таких знаковых организациях, как — ОАО «СаранскМежРайГаз», ЗАО «Конвертор»,...

Cертификация серверов на базе СП «Прометей» в 1С Серов

Теперь мы не просто 1С партнёр и франчайзи ! Серверная платформа «Прометей» и серверное решение 1С успешно прошли сертификацию совместимости Servers на базе СП «Прометей» в центральном офисе 1С Москва. 30 августа 2011. Наши сервера не только показали стабильную и надёжную работу с 1С: Платформой 8.2, но и дали ощутимый рост скорости и производительности. Что вызвано использованием в работе СП «Прометей» собственных разработок ООО «Код Эсперт» и ООО «Код Эксперт — РМ» в области оптимизации вычислений и распределения серверных ресурсов. А так же естественная высокая скорость усилия ОС Linux CentOs, на которой базируется комплекс СП «Прометей». Использование собственной полноценной, надёжной и совместимой версии серверного ПО позволяет нам существенно сократить стоимость внедрения 1С решений на ваших предприятиях. ...

создание корпоративного сайта цена Серов

Закажите у нас создание корпоративного сайта цена Серов которого устроит Ваш бюджет и поставленные цели. Мы готовы предложить Вам по самым выгодным условиям от простого корпоративного портала до сложно интегрированного портала в бизнес процессы Вашей деятельности. Ваш вебсайт создание стоимость Серов будет конечно зависеть от масштаба портала и поставленных целей. Вообще корпоративная on-line площадка может быть как простым информатором о Ваших усилийах и товарах, так и сложным многофункциональным ресурсом, целью которого не просто рассказать о Вас, но и предложить совершить пользователю действия на нем, такие как провести оплату, сделать заказ, посмотреть остатки и т.д., т.е. все необходимое для Вашего дела. Если создание корпоративного сайта цена может варьировать у разных поставщиков ИТ усилий и дополняться скрытыми усилийами, о которых Вы узнаете в процессе разработки портала, у нас Вы найдете прозрачное ценообразование без лишних и зачастую ненужных дополнений. Закажите...

Качественное сравнение методов сортировки Серов

Сортировка — часто встречается в работе разработчика. В то же время это высоко нагруженный процесс, который может существенно повлиять на скорость всего приложения. Потому исследуем вопрос алгоритмов сортировки на Python, рассмотрим наиболее известные варианты и определимся с наиболее быстрым из них. В добрый путь… Математические Параметры алгоритмов: Временная сложность: определяется как функция от длины строки, представляющей входные данные, равная времени усилия алгоритма на данном входе. Характеризует ожидаемое общее тактовое время (ОТВ), где такт это одна операция. Прямо влияет на Время исполнения, однако ОТВ и реальные временные затраты не совсем одно и тоже. Временная сложность отражает количество операций, но для разных алгоритмов скорость выполнения операций разное, в результате скорость алгоритмов с одной и той же временной сложностью, могут существенно отличаться. Пространство сложности: работает аналогично временной сложности. Характеризует — объёмы...