Sets#

Sets é uma estrutura de dados um tanto quanto interessante (e pouco falada, na minha visão). Trata-se de uma sequencia também, assim como lista e tuplas, mas com algumas características bem distintas:

  • Elementos únicos: Um set não permite que elementos duplicados sejam armazenados. Se você tentar adicionar o mesmo elemento mais de uma vez, ele será armazenado apenas uma vez.

  • Sem ordem definida: Os elementos em um set não têm uma ordem específica. Diferente de listas ou tuplas, onde a ordem dos elementos é importante, em sets a posição dos elementos não é garantida e pode variar.

  • Operações matemáticas: Sets suportam operações matemáticas como união, interseção, diferença e diferença simétrica, que são úteis para comparar e combinar conjuntos de dados.

Vamos aprofundar mais neste capítulo. Sugiro fortemente que você leia a documntação oficial sobre sets aqui, ela é a base deste capítulo todo.

Sintaxe básica#

a sintaxe básica para criar um set envolve colocar os elementos entre chaves {}. Por exemplo, conjunto = {1, 2, 3, 3} cria um set contendo os números 1, 2 e 3 (o 3 aparece apenas uma vez, pois o set elimina duplicatas de forma automática).

conjunto = {1, 2, 3, 3}
print(conjunto)
{1, 2, 3}

A diferença entre a sintaxe de um set e a de um dicionário está no formato e no propósito de cada estrutura, apesar de ambos se iniciarem com {}.

Nota (type)

Lembra da função type? Se quiser de fato conferir se uma variável que começa e termina com {} é um set ou dicionário, é possível verificar com a função type.

Um set é uma coleção de elementos únicos, sem nenhuma relação de chave e valor, e os elementos são separados por vírgulas dentro das chaves. Já um dicionário também é criado com chaves {}, mas ele armazena pares de chave e valor, como pessoa = {"nome": "João", "idade": 30}. No dicionário, cada chave é associada a um valor específico, enquanto no set, você apenas tem valores sem uma chave correspondente.

Portanto, a principal diferença na sintaxe é que em um set, você apenas lista os elementos, enquanto em um dicionário, você precisa especificar chaves e valores, separados por dois pontos :.

Caso de uso real#

Supondo que uma pessoa A tenha uma carteira de investimento com os seguintes fundos imobiliários: BPFF11, BTLG11, CSHG11, FEXC11, FIIB11, HFOF11, HGLG11 e HGRE11.

Uma outra pessoa B também tem uma outra carteira de fundos imobiliários com os seguintes fundos: BCFF11, FIIJ11, GGRC11, HFOF11, HGLG11, HGLG11, HGPO11 e HGRU11.

Com sets podemos rapidamente responder às seguintes perguntas:

investimentos_pessoa_a = {"BPFF11", "BTLG11", "CSHG11", "FEXC11", "FIIB11", "HFOF11", "HGLG11", "HGRE11"}
investimentos_pessoa_b = {"BCFF11","FIIJ11","GGRC11","HFOF11", "HGLG11","HGLG11", "HGPO11","HGRU11"}

# Quais são os ativos em comum entre as pessoas A e B?
investimentos_em_comum = investimentos_pessoa_a.intersection(investimentos_pessoa_b)
print(investimentos_em_comum)
{'HGLG11', 'HFOF11'}
investimentos_pessoa_a = {"BPFF11", "BTLG11", "CSHG11", "FEXC11", "FIIB11", "HFOF11", "HGLG11", "HGRE11"}
investimentos_pessoa_b = {"BCFF11","FIIJ11","GGRC11","HFOF11", "HGLG11","HGLG11", "HGPO11","HGRU11"}

# Quais são os ativos das carteiras de ambas as pessoas (A, B ou ambas)?
todos_os_ativos = investimentos_pessoa_a.union(investimentos_pessoa_b)
print(todos_os_ativos)
{'HGRE11', 'HGLG11', 'BTLG11', 'FIIB11', 'HGRU11', 'FIIJ11', 'BCFF11', 'FEXC11', 'BPFF11', 'HFOF11', 'GGRC11', 'HGPO11', 'CSHG11'}
investimentos_pessoa_a = {"BPFF11", "BTLG11", "CSHG11", "FEXC11", "FIIB11", "HFOF11", "HGLG11", "HGRE11"}
investimentos_pessoa_b = {"BCFF11","FIIJ11","GGRC11","HFOF11", "HGLG11","HGLG11", "HGPO11","HGRU11"}

# Quais são os ativos que somente a pessoa A tem em carteira?
investimentos_exclusivos_pessoa_a = investimentos_pessoa_a - investimentos_pessoa_b
print(investimentos_exclusivos_pessoa_a)
{'HGRE11', 'BTLG11', 'FIIB11', 'FEXC11', 'BPFF11', 'CSHG11'}
investimentos_pessoa_a = {"BPFF11", "BTLG11", "CSHG11", "FEXC11", "FIIB11", "HFOF11", "HGLG11", "HGRE11"}
investimentos_pessoa_b = {"BCFF11","FIIJ11","GGRC11","HFOF11", "HGLG11","HGLG11", "HGPO11","HGRU11"}

# Quais são os ativos que somente a pessoa B tem em carteira?
investimentos_exclusivos_pessoa_b = investimentos_pessoa_b - investimentos_pessoa_a
print(investimentos_exclusivos_pessoa_b)
{'HGRU11', 'FIIJ11', 'BCFF11', 'GGRC11', 'HGPO11'}

Teoria dos conjuntos#

Sets são a estrutura ideal para trabalharmos pensando em teoria dos conjuntos.Na teoria dos conjuntos, trabalhamos com operações que nos ajudam a combinar, comparar e manipular coleções de elementos. Em Python, a estrutura de dados set (conjunto) oferece uma maneira eficiente de realizar essas operações. Vamos explorar as principais operações entre conjuntos.

../_images/06-05-sets-theory.png

Teoria dos conjuntos (fonte: autoria própria)

União (Union)#

A união de dois conjuntos A e B resulta em um novo conjunto que contém todos os elementos de A e B, sem duplicatas. Em Python, usamos o operador | ou o método .union() para realizar a união.

conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

# Operador |
uniao = conjunto_a | conjunto_b
print(uniao)

uniao = conjunto_a.union(conjunto_b)
{1, 2, 3, 4, 5}
conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

# Método .union()
uniao = conjunto_a.union(conjunto_b)
print(uniao)
{1, 2, 3, 4, 5}

Intersecção (Intersection)#

A intersecção de dois conjuntos A e B resulta em um novo conjunto que contém apenas os elementos que estão em ambos os conjuntos. Em Python, usamos o operador & ou o método .intersection().

conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

interseccao = conjunto_a & conjunto_b
print(interseccao)
{3}
conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

interseccao = conjunto_a.intersection(conjunto_b)
print(interseccao)
{3}

Diferença (Difference)#

A diferença entre dois conjuntos A e B resulta em um novo conjunto que contém os elementos que estão em A, mas não em B. Usamos o operador de menos - ou o método .difference().

conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

diferenca = conjunto_a - conjunto_b
print(diferenca)
{1, 2}
conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

diferenca = conjunto_a.difference(conjunto_b)
print(diferenca)
{1, 2}

Diferença simétrica (symmetric difference)#

A diferença simétrica entre dois conjuntos A e B resulta em um novo conjunto que contém os elementos que estão em A ou B, mas não em ambos. Usamos o operador ^ ou o método .symmetric_difference().

conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

diferenca_simetrica = conjunto_a.symmetric_difference(conjunto_b)
print(diferenca_simetrica)
{1, 2, 4, 5}
conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

diferenca_simetrica = conjunto_a ^ conjunto_b
print(diferenca_simetrica)
{1, 2, 4, 5}

Verificação de continência (subset e superset)#

  • Subconjunto (subset): Verifica se todos os elementos de um conjunto estão presentes em outro conjunto. Usamos o operador <= ou o método .issubset().

  • Superconjunto (superset): Verifica se todos os elementos de um conjunto estão presentes em outro conjunto. Usamos o operador >= ou o método .issuperset().

conjunto_a = {1, 2, 3}
conjunto_b = {3, 4, 5}

conjunto_c = {1, 2}

print("Subconjunto")
print(f"O conjunto C é um subconjunto de A? Usando o operador <= : {conjunto_c <= conjunto_a}")
print(f"O conjunto C é um subconjunto de A? Usando o método .issubset() : {conjunto_c.issubset(conjunto_a)}\n")

print("Superconjunto")
print(f"O conjunto B é um superconjunto de C? Usando o operador >= : {conjunto_b >= conjunto_c}")
print(f"O conjunto B é um superconjunto de C? Usando o método .issuperset() : {conjunto_b.issuperset(conjunto_c)}")
Subconjunto
O conjunto C é um subconjunto de A? Usando o operador <= : True
O conjunto C é um subconjunto de A? Usando o método .issubset() : True

Superconjunto
O conjunto B é um superconjunto de C? Usando o operador >= : False
O conjunto B é um superconjunto de C? Usando o método .issuperset() : False

Pertencimento#

Podemos verificar se um elemento pertence a um conjunto usando o operador in ou not in.

conjunto_a = {1, 2, 3}

# Pertence
print(2 in conjunto_a)

# Não pertence
print(6 not in conjunto_a)
True
True

Prática#

Sugiro o exercício 11 da lista para você praticar a estrutura de sets.

Conclusão#

Neste capítulo, exploramos em detalhes os sets em Python, uma estrutura de dados fundamental para lidar com teoria dos conjuntos. Aprendemos que sets são coleções não ordenadas de elementos únicos, o que os torna extremamente úteis para tarefas como remoção de duplicatas, testes de pertinência e operações entre conjuntos.

Vimos como criar sets, adicionar e remover elementos, e realizar operações comuns, como união, interseção e diferença. Exploramos as principais propriedades dos sets, como a impossibilidade de duplicatas e a natureza desordenada dos elementos. Isso os torna uma escolha ideal quando a ordem dos elementos não é relevante, mas a unicidade é essencial.

Além disso, discutimos o uso prático de sets em situações do mundo real, como verificação de ações exclusivas em carteiras de investimentos, identificação de amigos em comum em redes sociais e muito mais. Demonstramos como os sets podem simplificar significativamente muitos problemas comuns, tornando-os uma ferramenta essencial no arsenal do desenvolvedor Python.

À medida que você continuar a explorar a linguagem Python, recomendo manter os sets em mente e considerar seu uso sempre que precisar trabalhar com coleções de elementos únicos. Sua eficiência e sua sintaxe concisa os tornam uma opção poderosa para uma ampla gama de tarefas de programação.

Com o domínio das estruturas de dados básicas, como strings, listas, tuplas, dicionários e sets, agora estamos prontos para avançar para o próximo tópico: fluxos de controle. Lá, aprenderemos a criar estruturas de decisão, os famosos if-else-elif e de repetição, for e while, que nos permitirão escrever códigos cada vez mais sofisticados e adaptáveis.