8-(927)-977-80-70 web-i-seo@yandex.ru
Режим работы: 10-00 до 20-00 МСК

Вы нашли нас по запросу -"Сравнение методов объединения двух отсортированных списков в Python Нерюнгри" - это лучшая рекомендация для подрядчика SEO продвижения в городе Нерюнгри или по России!

Сравнение методов объединения двух отсортированных списков в Python

Пусть у нас есть два списка (для простоты из целых чисел), каждый из которых отсортирован. Хотим объединить их в один список, который тоже должен быть отсортирован. Эта задача наверняка всем знакома, используется, например, при сортировке слиянием.

 

 

Способов реализации (особенно на python) достаточно много. Давайте разберем некоторые из них и сравним затрачиваемое время на разных входных данных.

Основная идея алгоритма заключается в том, что, поместив по одной метке в начале каждого списка, будем сравнивать отмеченные элементы, брать меньший из них и передвигать метку в его списке на следующее число. Когда один из списков кончается, нужно добавить остаток второго в конец.

 

Входные данные не меняются

Пусть есть два списка list1 и list2.

Начнем с самого простого алгоритма: обозначим метки за i и j и будем брать меньший из list1[i]list2[j] и увеличивать его метку на единицу, пока одна из меток не выйдет за границу списка.

При первом сравнении мы выберем минимальный элемент из двух минимальных в своем списке и подвинемся на следующий элемент, поэтому наименьший элемент из двух списков будет стоять на нулевом месте результирующего. Дальше несложно по индукции доказать, что далее слияние пройдет верно.

Перейдем к коду:

def simple_merge(list1, list2):
    i, j = 0, 0
    res = []
    while i < len(list1) and j < len(list2):
        if list1[i] < list2[j]:
            res.append(list1[i])
            i += 1
        else:
            res.append(list2[j])
            j += 1
    res += list1[i:]
    res += list2[j:] 
    # один из list1[i:] и list2[j:] будет уже пустой, поэтому добавится только нужный остаток
    return res

 

Заметим, что в данном коде используется только перемещение вперед по списку. Поэтому будет достаточно работать с итераторами. Перепишем алгоритм с помощью итераторов.

 

Еще изменим обработку концов списков, так как теперь мы не умеем копировать сразу до конца. Будем обрабатывать элементы до того, когда оба итератора дойдут до конца, при этом, если один уже оказался в конце, будем просто брать из второго.

 

def iter_merge(list1, list2):
    result, it1, it2 = [], iter(list1), iter(list2)
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            result.append(el2)
            el2 = next(it2, None)
        else:
            result.append(el1)
            el1 = next(it1, None)
    return result

 

В этой реализации можно вместо добавления по одному элементу (result.append()) собрать генератор, а потом из него получить список. Для этого напишем отдельную функцию, которая будет строить генератор, а основная функция сделает из него список.

 

def gen_merge_inner(it1, it2):
    el1 = next(it1, None)
    el2 = next(it2, None)
    while el1 is not None or el2 is not None:
        if el1 is None or (el2 is not None and el2 < el1):
            yield el2
            el2 = next(it2, None)
        else:
            yield el1
            el1 = next(it1, None)

def gen_merge(list1, list2):
    return list(gen_merge_inner(iter(list1), iter(list2))) # из генератора получаем список

 

Встроенные реализации

Рассмотрим еще несколько способов слияния через встроенные в python функции.

  • merge из heapq. Как говорит документация, эта функция делает именно то, что мы хотим, и больше: объединяет несколько итерируемых объекта, можно задать ключ, можно сортировать в обратном порядке.
    Тогда нам нужно просто импортировать и использовать:

    from heapq import merge
    
    def heapq_merge(list1, list2):
        return list(merge(list1, list2)) # тоже возвращает генератор
  • Counter из collectionsCounter умеет считать количество вхождений каждого из элементов, выдавать их в тех количествах, в которых они входят, и еще несколько полезных вещей, которые сейчас не нужны (например, несколько самых часто встречающихся элементов).
    Воспользуемся gen_merge_inner для слияния элементов Counter(list1) и Counter(list2):

    def counter_merge(list1, list2):
        return list(gen_merge_inner(Counter(list1).elements(), Counter(list2).elements()))
  • И, наконец, просто сортировка. Объединяем и сортируем заново. Тут есть два варианта реализация через sort() и sorted(). Сразу сравним их:
list1 = [i for i in range(1, 200000, 3)]
list2 = [i for i in range(2, 250000, 4)]
%timeit res1 = sorted(list1 + list2)
%timeit res2 = list1 + list2; res2.sort()
6.73 ms ± 64.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
4.43 ms ± 38.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

В результате:

    def sort_merge(list1, list2):
        return (list1 + list2).sort()

Если можно менять исходные списки

 

Предположим, что после слияния старые списки больше не нужны (как обычно и случается). Тогда можно написать еще один способ. Будем как и раньше сравнивать нулевые элементы списков и вызывать pop(0) у списка с меньшим, пока один из списков не закончится.

 

def pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[0] < list2[0] else list2).pop(0))
    return result + list1 + list2

 

Получили простенькую функцию на 4 строчки, но использовать дальше исходные списки не получится. Можно их скопировать, потом работать с копиями, но это потребует много дополнительного времени. Здесь будут проблемы с тем, что удаление нулевого элемента очень дорогое. Поэтому еще одна модификация будет заключаться в том, что мы будем вместо удаления из начала списка использовать удаление из конца, но придется в конце развернуть списки.

 

def reverse_pop_merge(list1, list2):
    result = []
    while list1 and list2:
        result.append((list1 if list1[-1] > list2[-1] else list2).pop(-1))
    return (result + list1[-1::-1] + list2[-1::-1])[-1::-1]

 

Сравнение

 

Пора перейти к самому интересному.
Составим список функций, которые будем сравнивать:

 

  • simple_merge
  • iter_merge
  • gen_merge
  • heapq_merge
  • counter_merge
  • sort_merge
  • pop_merge
  • reverse_pop_merge

 

Будем измерять время работы с помощью модуля timeit. Код можно посмотреть здесь.

 

Разберем несколько ситуаций: оба списка примерно одинакового размера, один список большой, а второй маленький, количество вариантов элементов большое, количество вариантов маленькое. Кроме этого проведем просто общий случайный тест.

Тест первый

 

Проведем общий тест, размеры от $1$ до $10^5$, элементы от $1$ до $10^6$.

 

Отдельно сравним pop и reverse_pop:

 

 

pop_merge тратит колоссально больше времени в общем случае, как и ожидалось.

 

Не будем учитывать здесь огромный pop_merge, чтобы лучше видеть разницу между другими:

 

 

reverse_pop_merge показал себя относительно неплохо по сравнению с ручной реализацией и heapq_merge.

 

Методы на итераторах работают еще быстрее, при этом видно, что получилось выгоднее построить генератор, чем добавлять элементы в список.

 

Тест второй, сравнимые размеры

 

Размеры будут принадлежать отрезку $[50x, 50(x+1))$, а $x$ увеличиваем, начиная с $1$. Шаг $50$.

 

 

Как уже можно видеть pop_merge при небольшом размере списков еще ведет себя как heapq_merge, а дальше обгоняет всех.

 

Тест третий, один маленький, второй большой

 

Размер первого равен $x$, размер второго $10^4 + 100x$.

 

 

В самом начале (на очень маленьких списках) reverse_pop_merge обгоняет всех, кроме sort_merge, но на чуть больших все выходит на стандартные позиции.

 

Тест четвертый, много повторных

 

Размеры фиксированы, а количество элементов увеличивается на $5$, начиная с $1$.

 

 

Как видно, на достаточно малых количествах counter_merge оказывается быстрее reverse_pop_merge и heapq_merge, но потом он отстает.

 

Чемпионы

Абсолютным победителем оказался sort_merge! Гораздо быстрее просто отсортировать список заново, чем использовать вроде бы линейные от длины списков функции.

На втором месте в подавляющем большинстве случаев идет gen_merge, за ним следует iter_merge.

Остальные методы используют еще больше времени, но некоторые в каких-то крайних случаях достигают результатов 2-3 мест.

Дата изменения


Индивидуальный Предприниматель Ознобин Р.А.
8-927-977-80-70
Адрес: г. Нерюнгри, ул. Строителей, строение 12

Полезная информация по теме - Сравнение методов объединения двух отсортированных списков в Python Нерюнгри

стоимость медицинского сайта Нерюнгри

Готовы Вам оказать сервис по производству и оптимизации информации о Ваших товарах и усилийах. стоимость медицинского сайта Нерюнгри Вы можете узнать ознакомившись с нашими ценами по производству или разработки торговой on-line площадки, а так же предлагаем Вам ознакомиться и выбрать подходящий тариф для адаптации медицинского сайта. Стоимость медицинского сайта  Нерюнгри может включать в себя установку концепции, его индивидуальный дизайн, проработку юзабилити, покупку домена и размещение его на серверной платформе. Но задумайтесь о том, как люди будут находить Вас в web сети. Большинство сегодня ищут данные в поисковых комплексах. По этому в стоимость медицинского сайта так же может быть включена общая усилийа по оптимизации, которая привлечет пользователей ищущих медицинские сервис или лекарства в сети, т.е. Ваших потенциальных клиентов. Если у Вас возникли вопросы или вы хотите рассчитать стоимость медицинского сайта  Нерюнгри, то оставьте заявку онлайн или же свяжитесь для...

Веб-студия дизайнера интерьера Нерюнгри

Создан сайт дизайнера интерьера Виктории Киосаk. Плюс техническое обслуживание и SEO раскрутка. Вебсайт дизайнера интерьера это сайт творческой мастерской, тот особый случай, когда дизайн — «продаёт» Ваш продукт на прямую. Поэтому в данном портале было особое внимание уделено дизайну сайта. Сравнение методов объединения двух отсортированных списков в Python — получи СКИДКУ 10% Базовая установка от — 9 600 руб. ! эксклюзивного дизайна и визуальных элементов — 60 000 руб.. наполнение материалами — от 300 до 1000 руб. за страницу  (в зависимости от наличия и объёмов таблиц, фото и текстов). Что бы заказать сайт у нас, вам надо лишь отправить заявку с данного сайта или связаться с нами любым из перечисленных в разделе Контакты методов. Мы свяжемся с Вами и поможем определится с техническим заданием, дизайном и ценой сайта. ООО «Код Эксперт —...

Удаление четных или нечётных элементов из списка Нерюнгри

Обычный способ Из списка a[] содержащего значения типа int удаление производится легко: a = [x for x in a if x%2] #удаление чётных чисел a = [x for x in a not x%2] #удаление нечётных чисел Если список содержит другие типы данных (Приводимых к типу int, например String необходимо выполнить преобразование типа: a1 = [x for x in a if int(x)%2] # Выбираем четные числа a2 = [x for x in a if not int(x)%2] # Выбираем нечетные числа Заметьте, что списки a1 и a2 будут также содержать переменные строкового типа. А если Вам нужно хранить переменные целочисленного типа, нужно их преобразовать. a1 = [int(x) for x in a if int(x)%2] a2 = [int(x) for x in a if not int(x)%2] С помощью filter и lambda Для выборки из списка элементов, удовлетворяющих какому-то условию, можно воспользоваться методом filter: a = list(filter(lambda x: int(x) % 2, a)) // Оставляем только нечётные a = list(filter(lambda x: not int(x) % 2, a)) // Оставляем только чётные ; С помощью Numpy Для эффективного...

Сайт производителя ЖБИ Нерюнгри

Создан сайт ООО «ПК ЖБИ МАРК». ООО «ПК ЖБИ МАРК» производство — ЖБИ. В состав компании входит  завод ЖБИ, производственные мощности которого позволяют обеспечить железобетонными изделиями строительство любых объектов. Завод ООО «ПК ЖБИ МАРК» расположен в г. Москве, это позволяет заказчику осуществлять доставку и по городу, и по области с минимальными затратами, что значительно снижает конечную стоимость ЖБИ для потребителей. Современное производство, контроль качества, строгое выполнение договорных обязательств — основные критерии деятельности организации. Сайт разработан с использованием СМS Joomla. Посмотреть сайт заказчика … ...

8 основных структур данных в Python Нерюнгри

Структуры данных — это структуры кода для хранения и организации данных, которые упрощают изменение, навигацию и доступ к информации. Структуры данных определяют способ сбора данных, функциональные возможности, которые мы можем реализовать, и отношения между данными. Структуры данных используются практически во всех областях информатики и программирования, от операционных систем до интерфейсной разработки и машинного обучения. Структуры данных помогают: Управляйте большими наборами данных и используйте их. Быстрый поиск определённых данных в базе данных. Создавайте чёткие иерархические или реляционные связи между точками данных. Упростите и ускорьте обработку данных. Структуры данных являются жизненно важными строительными блоками для эффективного решения реальных проблем. Структуры данных — это проверенные и оптимизированные инструменты, которые дают вам удобную основу для организации ваших программ. В конце концов, вам не нужно переделывать колесо (или конструкцию) каждый раз,...

разработка сайта компании Нерюнгри

За короткий срок и по доступной цене создание сайта компании Нерюнгри с последующим обслуживанием и раскруткам. Делаем простые и сложные автоматизированные и продающие on-line витрины и корпоративные площадки. Нашими основными направлениями являются создание и раскрутка порталов компании Нерюнгри, любой сложности и функционала. Выбирая разработчика Вы увидите большое количество предложений которые усложняют Ваш выбор, особенно если Вы не специалист данной области. Пытаясь самостоятельно разобраться с чего начинается создание портала для компании, Вам придется изучить тонкости on-lineа, стандарты разработки ИТ порталов, оптимизацию программных процессов (скорость загрузки очень важна для посетителей), провести анализ взаимодействия с поисковыми системами и многие другие нюансы разработки — раскрутки порталов. компании занимающиеся разработкой сайтов Нерюнгри, расскажут Вам хорошую историю, сделают убедительную презентацию, но от куда Вы будете знать, что результат...

стоимость создания сайта Нерюнгри

Определите выгодную для себя стоимость разработки сайта Нерюнгри которая будет соответствовать целям Вашего дела. Мы готовы предложить Вам от простой визитки компании до сложного корпоративного портала, с внутренними CRM системами и системами обмена данных. Готовы разработать продающий on-line-магазин под ключ или витрину Вашей компании. В стоимость разработки водит ряд действий и сервиса по обслуживанию портала в дальнейшем. Для начала мы подберем для Вас наименование или доменное имя портала. Вы выберете наиболее подходящий и понравившийся Вам домен и при создании стоимость сайтподключ будет включать в себя домен в зоне  com, ru и т.д. Создание сайта стоимость Нерюнгри будет включать в себя оплату домена, хостинга где разместиться портал, настройка и размещение платформы, правка платформы под требование и условия Вашего дела. Возможно добавить в перечень дизайнерское исполнение портала или оставить стоимость разработки сайта Нерюнгри под ключ где Вам будут предложены типовые...

продвижение сайта в топ цена Нерюнгри

Вывести свой бизнес на новый рынок или увеличить долю продав в web сети позволяет сервис раскрутка сайта в топ цена Нерюнгри указана ниже в таблице, где Вы можете выбрать наиболее для Вас подходящий и выгодный вариант. раскрутка сайта в топ цена Нерюнгри — При предоплате за 3-месяца и получи скидку 10%. Вы нашли нас в ТОП10 поиска по запросу «раскрутка сайта в топ цена» Нерюнгри — это лучшая реклама!!! Раскрутка on-line портала в Вашем городе Нерюнгри или других регионах уже включает в себя комплексное обслуживание, в том числе закупку и ручной обмен внешними ссылками, ручная корректировка метаданных вашего контента и создание качественного целевого контента в ведомых разделах, трансляция целевого контента в «соцсети поддержки». В правильно ориентированном контенте есть много «подводных камней» и текст должен быть выверен до мелочей. Важно не просто правильно подстроенный контента под поисковую систему, но и...