# Primeritat i factorització

###  Artur Travesa

#### (versió 2024-07)

# Capítol 0. Un garbell d'Eratòstenes

El garbell d'Eratòstenes és la primera eina que podem utilitzar per a fer llistes de nombres primers. Sovint se'n parla a l'ensenyament bàsic o secundari, tot i que, també sovint, sense justificació. 

El procediment bàsic és molt senzill: es tracta de fer una llista de tots els nombres menors que una certa fita i teure'n els compostos d'una manera prou eficient. D'aquesta manera, els nombres que queden a la llista són (els) primers.

A més a més de ser útil per a obtenir llistes de nombres primers, el garbell servirà per a altres algoritmes posteriors de factorització de nombres naturals.

## 0.0. Una versió bàsica

A partir d'una llista de bits (inicialment, uns) que representen el nombre 2 i els nombres senars des de 3 fins a una certa fita, es tracta de treure (posar a zero) els bits que corresponen a múltiples (no primers) dels nombres primers. Aquests, són els que es corresponen amb els bits que queden sense suprimir.

La teoria en què es fonamenta l'algoritme es pot veure, per exemple, en <b>[Tr-Ar</b>, cap. II, $\S$3.6<b>]</b>.

La funció següent és una implementació bàsica del garbell d'Eratòstenes, 

In [None]:
def Eratostenes(ff):
    f=floor((ff+1)/2)
    pr=[1 for i in range(f)]
    i=1
    k=floor((sqrt(ff)+1)/2)
    while i<k:
        if pr[i]==1:
            for j in range(2*i*(i+1),f,2*i+1):
                pr[j]=0
        i=i+1
    return pr


Notem que aquesta funció només calcula una llista de zeros i uns, amb un 1 en el primer lloc (el lloc n=0, pensat per al primer 2), un 1 en els llocs n-èsims (n>=1) que corresponen als nombres primers senars 2n+1, i un zero en els altres, que corresponen als nombres compostos senars, 2n+1.

Aquesta llista de zeros i uns hauria de ser suficient per a moltes aplicacions, ja que el valor concret del nombre primer es calcula fàcilment a partir de l'índex del lloc que ocupa el bit corresponent i, en canvi, és més senzill (i, molt important, consumeix menys recursos) emmagatzemar aquesta llista.

### 0.0.0 Exemples

Per a $f\ge 1$ la funció <b>Eratostenes(ff)</b> proporciona una llista no buida. 

In [None]:
Eratostenes(1)

In [None]:
Eratostenes(25)

In [None]:
er=Eratostenes(100)

In [None]:
print(er)

In [None]:
%time er=Eratostenes(10000)

In [None]:
%time er=Eratostenes(1000000)

In [None]:
%time er=Eratostenes(10000000)

## 0.1. La llista dels nombres primers

In [None]:
def LlistaDePrimers(ff):
    f=floor((ff+1)/2)
    pr=[1 for i in range(f)]
    i=1
    k=floor((sqrt(ff)+1)/2)
    while i<k:
        if pr[i]==1:
            for j in range(2*i*(i+1),f,2*i+1):
                pr[j]=0
        i=i+1
    lta=[pr[n]*(2*n+1) for n in range(f) if pr[n]>0]
    lta[0]=2
    return lta


In [None]:
LlistaDePrimers(25)

In [None]:
print(LlistaDePrimers(103))

In [None]:
%time lta=LlistaDePrimers(10000)

In [None]:
len(lta)

In [None]:
%time lta=LlistaDePrimers(1000000)

In [None]:
len(lta)

In [None]:
%time lta=LlistaDePrimers(10000000)

In [None]:
len(lta)

## 0.2. Observacions

### Sobre la fita
La funció <b>LlistaDePrimers(ff)</b> calcula la llista dels nombres naturals primers menors que una fita "raonable" en un temps "raonable". Però notem que la necessitat d'espai és proporcional al valor de la fita; per tant, exponencial en el nombre de bits de la fita. Això fa que les fites "raonables" no puguin ser extraordinàriament grans.

### Sobre la programació
Aquesta implementació de les funcions <b>Eratostenes(ff)</b> i <b>LlistaDePrimers(ff)</b> no és, ni de bon tros, òptima. 

D'una banda, una bona implementació hauria de fer servir només un bit per a indicar la posició de cada nombre senar menor que la fita; en canvi, aquesta implementació utilitza, probablement, un mínim d'un byte per a cadascuna d'aquestes posicions (si no n'utilitza més). 

A més a més, probablement caldria treballar directament sobre bits i no sobre bytes. Segurament, seria un bon exercici de programació, lluny de l'objectiu que perseguim, fer-ne la programació en llenguatge assemblador; això podria servir, per exemple, per a estudiar la velocitat real dels processadors i el seu comportament en tasques no trivials. Però no insistiré més en aquest fet.

D'altra banda, es fa sempre l'assignació pr[j]=0. Caldria veure si això és més o menys eficient que fer l'assignació condicionada només al cas en què sigui pr[j]=1; és a dir, si és més o menys eficient que utilitzar la comanda if pr[j]==1: pr[j]=0.

D'altra banda, a més a més del càlcul de les posicions que ens permeten dir quins són els nombres primers, la funció <b>LlistaDePrimers(ff)</b> calcula explícitament aquests nombres, fet que és, gairebé sempre, innecessari.

### Sobre l'emmagatzemament
Notem també que per a emmagatzemar el resultat és molt més costós fer-ho amb la llista dels valors que només amb la successió de bits.

Per exemple, per a emmagatzemar els primers fins a 100, si es contempla una successió de bits, només en calen 50. Però si es volen emmagatzemar els valors en la seva forma més compacta (expressions binàries), i es té en compte que el nombre primer més gran menor que 100 (que és 97) necessita 7 bits, hauríem de fer servir 7 bits per a cadascun dels valors menors (caldria saber on comença i on acaba cada nombre primer) de manera que per als 25 nombres primers necessitaríem 175 bits (tres vegades i mitja més que la llista de bits).

I si es volguessin emmagatzemar els 664579 nombres primers menors que 10000000, i en tenir en compte que el més gran, 9999991, és de 24 bits, necessitaríem 15949896 bits, en comptes dels 5000000 necessaris per a emmagatzemar la llista de bits (ara, gairebé 3.2 vegades més).

### Sobre el SageMath
<i>SageMath</i> té implementada la funció prime_range( ) que permet resoldre aquesta tasca molt ràpidament, i amb més prestacions.

In [None]:
%time lta1=prime_range(10000000)

In [None]:
len(lta1)

## Fi del Capítol 0