Решето Эратосфена

Решето Эратосфена — алгоритм нахождения всех простых чисел до некоторого целого числа , который приписывают древнегреческому математику Эратосфену Киренскому. Как и во многих случаях, здесь название алгоритма говорит о принципе его работы, то есть решето подразумевает фильтрацию, в данном случае фильтрацию всех чисел за исключением простых. По мере прохождения списка нужные числа остаются, а ненужные (они называются составными) исключаются.

История


 Название «решето» метод получил потому, что, согласно легенде, Эратосфен писал числа на дощечке, покрытой воском, и прокалывал дырочки в тех местах, где были написаны составные числа. Поэтому дощечка являлась неким подобием решета, через которое «просеивались» все составные числа, а оставались только числа простые. Эратосфен дал таблицу простых чисел до 1000.

Алгоритм


 Для нахождения всех простых чисел не больше заданного числа n, следуя методу Эратосфена, нужно выполнить следующие шаги:

  1. Выписать подряд все целые числа от двух до n (2, 3, 4, \ldots, n).
  2. Пусть переменная p изначально равна двум — первому простому числу.
  3. Зачеркнуть в списке числа от 2p до n считая шагами по p (это будут числа кратные p: 2p, 3p, 4p, \ldots).
  4. Найти первое незачёркнутое число в списке, большее чем p, и присвоить значению переменной p это число.
  5. Повторять шаги 3 и 4, пока возможно.

 Теперь все незачёркнутые числа в списке — это все простые числа от 2 до n.
 На практике, алгоритм можно улучшить следующим образом. На шаге № 3 числа можно зачеркивать начиная сразу с числа p2, потому что все составные числа меньше него уже будут зачеркнуты к этому времени. И, соответственно, останавливать алгоритм можно, когда p2 станет больше, чем n. Также, все простые числа (кроме 2) — нечётные числа, и поэтому для них можно считать шагами по 2p, начиная с p2.

Сложность алгоритма


 Сложность алгоритма составляет O(nlog(logn)) операций при составлении таблицы простых чисел до n.

Доказательство сложности


 При выбранном nN для каждого простого pP:pn будет выполняться внутренний цикл, который совершит np действий. Следовательно, нужно оценить следующую величину:
pP:pnnp=npP:pn1p
 Так как количество простых чисел, меньших либо равных n, оценивается как nlnn, и, как следствие, k-е простое число примерно равно klnk, то сумму можно преобразовать:
pP:pn1p12+k=2nlnn1klnk
 Здесь из суммы выделено слагаемое для первого простого числа, чтобы избежать деления на нуль. Теперь следует оценить эту сумму интегралом:
12+k=2nlnn1klnk2nlnn1klnkdk=lnlnk|2nlnn=lnlnnlnnlnln2=ln(lnnlnlnn)lnln2lnlnn
 В итоге получается для изначальной суммы:
pP:pnnpnlnlnn+o(n)
 Более строгое доказательство (и дающее более точную оценку с точностью до константных множителей) можно найти в книге Hardy и Wright «An Introduction to the Theory of Numbers».

Псевдокод


 Оптимизированная реализация (начинающаяся с квадратов) на псевдокоде:
\textttВход\texttt: натуральное число \textttn\\\\\textttПусть \textttA\texttt — булевый массив, индексируемый числами от 2 до \textttn\texttt, \\\textttизначально заполненный значениями \texttttrue\texttt.\\\\\texttt \textttдля\texttt \texttti\texttt := 2, 3, 4, ..., \textttпока\texttt \texttti\texttt2\texttt ≤ \textttn\texttt:\\\texttt  \textttесли\texttt \textttA\texttt[\texttti\texttt] = \texttttrue\texttt:\\\texttt    \textttдля\texttt \textttj\texttt := \texttti\texttt2\texttt, \texttti\texttt2\texttt + \texttti\texttt, \texttti\texttt2\texttt + 2\texttti\texttt, ..., \textttпока\texttt \textttj\texttt ≤ \textttn\texttt:\\\texttt      \textttA\texttt[\textttj\texttt] := \textttfalse\\\\\textttВыход\texttt: числа \texttti\texttt, для которых \textttA\texttt[\texttti\texttt] = \texttttrue\texttt.
 == Пример для n = 30 == Запишем натуральные числа начиная от до в ряд:
 \texttt2  3  4  5  6  7  8  9  10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
 Первое число в списке,  — простое. Пройдём по ряду чисел, зачёркивая все числа кратные (то есть каждое второе, начиная с ):
 \texttt2  3 \texttt 4 \texttt 5 \texttt 6 \texttt 7 \texttt 8 \texttt 9  \texttt10\texttt 11 \texttt12\texttt 13 \texttt14\texttt 15 \texttt16\texttt 17 \texttt18\texttt 19 \texttt20\texttt 21 \texttt22\texttt 23 \texttt24\texttt 25 \texttt26\texttt 27 \texttt28\texttt 29 \texttt30
 Следующее незачеркнутое число,  — простое. Пройдём по ряду чисел, зачёркивая все числа кратные (то есть каждое третье, начиная с ):
 \texttt2  3 \texttt 4 \texttt 5 \texttt 6 \texttt 7 \texttt 8 \texttt 9 \texttt 10\texttt 11 \texttt12\texttt 13 \texttt14 \texttt15 \texttt16\texttt 17 \texttt18\texttt 19 \texttt20 \texttt21 \texttt22\texttt 23 \texttt24\texttt 25 \texttt26 \texttt27 \texttt28\texttt 29 \texttt30
 Следующее незачеркнутое число,  — простое. Пройдём по ряду чисел, зачёркивая все числа кратные 5 (то есть каждое пятое, начиная с ). И т. д.
 \texttt2  3 \texttt 4 \texttt 5 \texttt 6 \texttt 7 \texttt 8 \texttt 9 \texttt 10\texttt 11 \texttt12\texttt 13 \texttt14 \texttt15 \texttt16\texttt 17 \texttt18\texttt 19 \texttt20 \texttt21 \texttt22\texttt 23 \texttt24 \texttt25 \texttt26 \texttt27 \texttt28\texttt 29 \texttt30
 Следующее незачеркнутое число — . Его квадрат, — больше -ти, поэтому на этом работа завершена. Все составные числа уже зачеркнуты:
 \texttt2  3     5     7           11    13          17    19          23                29

Модификации метода


Неограниченный, постепенный вариант


 В этом варианте простые числа вычисляются последовательно, без ограничения сверху, как числа находящиеся в промежутках между составными числами, которые вычисляются для каждого простого числа , начиная с его квадрата, с шагом в (или для нечетных простых чисел ). Может быть представлен символически в парадигме потоков данных как
 \texttt \textttprimes \texttt= \texttt[\texttt2\texttt..] \texttt\{ \textttp²\texttt, \textttp²\texttt+\textttp\texttt..] \textttfor \textttp \textttin \textttprimes\texttt]
 используя нотацию абстракции списков, где \texttt\{ обозначает разницу между арифметическими прогрессиями.
 Первое простое число (среди возрастающих положительных целых чисел) заранее известно, поэтому в этом самореферентном определении нет порочного круга.

Перебор делителей


 Решето Эратосфена часто путают с алгоритмами, которые отфильтровывают из заданного интервала составные числа, тестируя каждое из чисел-кандидатов с помощью перебора делителей.
 Широко известный функциональный код Дэвида Тёрнера 1975 года часто принимают за решето Эратосфена, но на самом деле это далёкий от оптимального вариант с перебором делителей.

Решето Эйлера


 Решето Эйлера это вариант решета Эратосфена, в котором каждое составное число удаляется из списка только один раз.
 Составляется исходный список начиная с числа . На каждом этапе алгоритма первый номер в списке берется как следующее простое число, и определяются его произведения на каждое число в списке которые маркируются для последуюшего удаления. После этого из списка убирают первое число и все помеченные числа, и процесс повторяется вновь:
 \\\texttt[2] (3) 5  7 \texttt 9\texttt 11  13 \texttt15\texttt 17 19 \texttt21\texttt 23 25 \texttt27\texttt 29 31 \texttt33\texttt 35 37 \texttt39\texttt 41 43 \texttt45\texttt 47 49 \texttt51\texttt 53 55 \texttt57\texttt 59 61 \texttt63\texttt 65 67 \texttt69\texttt 71 73 \texttt75\texttt 77 79  ...\\\texttt[3]    (5) 7    11  13    17 19    23 \texttt25\texttt    29 31    \texttt35\texttt 37    41 43    47 49    53 \texttt55\texttt    59 61    \texttt65\texttt 67    71 73    77 79  ...\\\texttt[4]       (7)   11  13    17 19    23       29 31       37    41 43    47 \texttt49\texttt    53       59 61       67    71 73    \texttt77\texttt 79  ...\\\texttt[5]            (11) 13    17 19    23       29 31       37    41 43    47       53       59 61       67    71 73       79  ...\\\texttt[...]\\
 Здесь показан пример начиная с нечетных чисел, после первого этапа алгоритма. Таким образом, после -го этапа рабочий список содержит только числа взаимно простые с первыми простыми числами (то есть числа не кратные ни одному из первых простых чисел), и начинается с -го простого числа. Все числа в списке, меньшие квадрата его первого числа, являются простыми.

Решето только по нечётным числам


 Поскольку все чётные числа, кроме 2, — составные, то можно вообще не обрабатывать никак чётные числа, а оперировать только нечётными числами. Во-первых, это позволит вдвое сократить объём требуемой памяти. Во-вторых, это уменьшит количество выполняемых алгоритмом операций (примерно вдвое).
 Это можно обобщить на числа взаимно простые не только с 2 (то есть нечетные числа), но и с 3, 5, и т. д.

Уменьшение объёма потребляемой памяти


 Алгоритм Эратосфена фактически оперирует с n битами памяти. Следовательно, можно существенно сэкономить потребление памяти, храня n переменных булевского типа не как n байт, а как n бит, то есть n/8 байт памяти.
 Такой подход — «битовое сжатие» — усложняет оперирование этими битами. Любое чтение или запись бита будут представлять собой несколько арифметических операций. Но с другой стороны существенно улучшается компактность в памяти. Большие интервалы умещаются в кэш-память которая работает гораздо быстрее обычной так что при работе по-сегментно общая скорость увеличивается.

Решето Эратосфена с линейным временем работы


 Этот алгоритм обнаруживает для каждого числа в отрезке его минимальный простой делитель .
 Также поддерживается список всех простых чисел — массив , поначалу пустой. В ходе работы алгоритма этот массив будет постепенно заполняться.
 Изначально все величины заполним нулями.
 Дальше следует перебрать текущее число от до . Здесь может быть два случая:

  •   : это означает, что число  — простое, так как для него так и не обнаружилось других делителей.

 Следовательно, надо присвоить и добавить в конец списка .

  •   : это означает, что текущее число  — составное, и его минимальным простым делителем является .

 В обоих случаях дальше начинается процесс расстановки значений в массиве : следует брать числа, кратные , и обновлять у них значение . Однако основная цель — научиться делать это таким образом, чтобы в итоге у каждого числа значение было бы установлено не более одного раза.
 Утверждается, что для этого можно поступить таким образом. Рассматриваются числа вида , где  последовательно равно всем простым числам не превосходящим (как раз для этого понадобилось хранить список всех простых чисел).
 У всех чисел такого вида проставим новое значение  — оно должно быть равно .

agraphПсевдокод
 \texttt \textttВход\texttt: натуральное число \textttn\\\\\textttПусть \textttpr\texttt - целочисленный массив, поначалу пустой;\\\texttt      \textttlp\texttt - целочисленный массив, индексируемый от 2 до \textttn\texttt, заполненный нулями\\\\\texttt \textttдля\texttt \texttti\texttt := 2, 3, 4, ..., \textttдо\texttt \textttn\texttt: \\\texttt   \textttесли\texttt \textttlp\texttt[\texttti\texttt] = \texttt0\texttt:\\\texttt       \textttlp\texttt[\texttti\texttt] := \texttti\\\texttt       \textttpr\texttt[] += \{\texttti\texttt\}\\\texttt   \textttдля\texttt \textttp\texttt из \textttpr\texttt пока \textttp\texttt ≤ \textttlp\texttt[\texttti\texttt] и \textttp*i\texttt ≤ \textttn\texttt:\\\texttt       \textttlp\texttt[\textttp*i\texttt] := \textttp\\\\\textttВыход\texttt: все числа в массиве \textttpr\texttt.