Aprendizado de máquina para engenheiros de software

Primeira página > Programação > Aprendizado de máquina para engenheiros de software

Aprendizado de máquina para engenheiros de software

Publicado em 2024-08-07

Navegar:586

Machine Learning for Software Engineers

Deixe-me saber se você acha isso valioso e continuarei!

Capítulo 1 - O modelo linear

Um dos conceitos mais simples, porém poderosos, é o modelo linear.

No ML, um dos nossos principais objetivos é fazer previsões com base em dados. O modelo linear é como o "Hello World" do aprendizado de máquina - é simples, mas constitui a base para a compreensão de modelos mais complexos.

Vamos construir um modelo para prever os preços das casas. Neste exemplo, a saída é o "preço da casa" esperado e suas entradas serão coisas como "pés quadrados", "num_quartos", etc...

def prediction(sqft, num_bedrooms, num_baths):
    weight_1, weight_2, weight_3 = .0, .0, .0  
    home_price = weight_1*sqft, weight_2*num_bedrooms, weight_3*num_baths
    return home_price

Você notará um "peso" para cada entrada. Esses pesos são o que criam a magia por trás da previsão. Este exemplo é enfadonho porque sempre produzirá zero, pois os pesos são zero.

Então vamos descobrir como podemos encontrar esses pesos.

Encontrando os pesos

O processo para encontrar os pesos é chamado de "treinamento" do modelo.

Primeiro, precisamos de um conjunto de dados de casas com características conhecidas (entradas) e preços (saídas). Por exemplo:

data = [
    {"sqft": 1000, "bedrooms": 2, "baths": 1, "price": 200000},
    {"sqft": 1500, "bedrooms": 3, "baths": 2, "price": 300000},
    # ... more data points ...
]

Antes de criarmos uma maneira de atualizar nossos pesos, precisamos saber até que ponto nossas previsões estão erradas. Podemos calcular a diferença entre nossa previsão e o valor real.

home_price = prediction(1000, 2, 1) # our weights are currently zero, so this is zero
actual_value = 200000

error = home_price - actual_value # 0 - 200000 we are way off. 
# let's square this value so we aren't dealing with negatives
error = home_price**2

Agora que temos uma maneira de saber o quanto estamos errados (erro) para um ponto de dados, podemos calcular o erro médio em todos os pontos de dados. Isso é comumente referido como erro quadrático médio.

Finalmente, atualize os pesos de uma forma que reduza o erro quadrático médio.

Poderíamos, é claro, escolher números aleatórios e continuar salvando o melhor valor à medida que avançamos - mas isso é ineficiente. Então, vamos explorar um método diferente: descida gradiente.

Gradiente descendente

Gradiente descendente é um algoritmo de otimização usado para encontrar os melhores pesos para nosso modelo.

O gradiente é um vetor que nos diz como o erro muda à medida que fazemos pequenas alterações em cada peso.

Intuição da barra lateral
Imagine estar em uma paisagem montanhosa e seu objetivo é chegar ao ponto mais baixo (o erro mínimo). O gradiente é como uma bússola que sempre aponta para a subida mais íngreme. Ao ir contra a direção do gradiente, estamos dando passos em direção ao ponto mais baixo.

Funciona assim:

Comece com pesos aleatórios (ou zeros).
Calcule o erro para os pesos atuais.
Calcule o gradiente (inclinação) do erro para cada peso.
Atualize os pesos movendo um pequeno passo na direção que reduz o erro.
Repita as etapas 2 a 4 até que o erro pare de diminuir significativamente.

Como calculamos o gradiente para cada erro?

Uma maneira de calcular o gradiente é fazer pequenas mudanças no peso, ver como isso impactou nosso erro e ver para onde devemos nos mover a partir daí.

def calculate_gradient(weight, data, feature_index, step_size=1e-5):
    original_error = calculate_mean_squared_error(weight, data)

    # Slightly increase the weight
    weight[feature_index]  = step_size
    new_error = calculate_mean_squared_error(weight, data)

    # Calculate the slope
    gradient = (new_error - original_error) / step_size

    # Reset the weight
    weight[feature_index] -= step_size

    return gradient

Detalhamento passo a passo

Parâmetros de entrada:
- peso: O conjunto atual de pesos para nosso modelo.
- dados: nosso conjunto de dados de características e preços de casas.
- feature_index: o peso para o qual estamos calculando o gradiente (0 para pés quadrados, 1 para quartos, 2 para banheiros).
- step_size: Um pequeno valor que usamos para alterar ligeiramente o peso (o padrão é 1e-5 ou 0,00001).
Calcular erro original:

   original_error = calculate_mean_squared_error(weight, data)

Primeiro calculamos o erro quadrático médio com nossos pesos atuais. Isso nos dá nosso ponto de partida.

Aumente ligeiramente o peso:

   weight[feature_index]  = step_size

Aumentamos o peso em uma pequena quantidade (step_size). Isso nos permite ver como uma pequena mudança no peso afeta nosso erro.

Calcular novo erro:

   new_error = calculate_mean_squared_error(weight, data)

Calculamos o erro quadrático médio novamente com o peso ligeiramente aumentado.

Calcular a inclinação (gradiente):

   gradient = (new_error - original_error) / step_size

Este é o passo principal. Estamos perguntando: "Quanto mudou o erro quando aumentamos ligeiramente o peso?"

Se new_error > original_error, o gradiente é positivo, o que significa que aumentar esse peso aumenta o erro.
Se new_error
A magnitude nos diz quão sensível é o erro às mudanças neste peso.
- Redefinir o peso:

   weight[feature_index] -= step_size

Colocamos o peso de volta ao valor original, pois estávamos testando o que aconteceria se o alterássemos.

Retornar o gradiente:

   return gradient

Retornamos o gradiente calculado para esse peso.

Isso é chamado de "cálculo de gradiente numérico" ou "método de diferença finita". Estamos aproximando o gradiente em vez de calculá-lo analiticamente.

Vamos atualizar os pesos

Agora que temos nossos gradientes, podemos empurrar nossos pesos na direção oposta do gradiente subtraindo o gradiente.

weights[i] -= gradients[i]

Se nosso gradiente for muito grande, poderíamos facilmente ultrapassar nosso mínimo atualizando demais nosso peso. Para corrigir isso, podemos multiplicar o gradiente por algum número pequeno:

learning_rate = 0.00001
weights[i] -= learning_rate*gradients[i]

E aqui está como fazemos isso para todos os pesos:

def gradient_descent(data, learning_rate=0.00001, num_iterations=1000):
    weights = [0, 0, 0]  # Start with zero weights

    for _ in range(num_iterations):
        gradients = [
            calculate_gradient(weights, data, 0), # sqft
            calculate_gradient(weights, data, 1), # bedrooms
            calculate_gradient(weights, data, 2)  # bathrooms
        ]

        # Update each weight
        for i in range(3):
            weights[i] -= learning_rate * gradients[i]

        if _ % 100 == 0:
            error = calculate_mean_squared_error(weights, data)
            print(f"Iteration {_}, Error: {error}, Weights: {weights}")

    return weights

Finalmente, temos nossos pesos!

Interpretando o Modelo

Depois de termos nossos pesos treinados, podemos usá-los para interpretar nosso modelo:

O peso para 'pés quadrados' representa o aumento de preço por pé quadrado.
O peso para 'quartos' representa o aumento de preço por quarto adicional.
O peso para 'banhos' representa o aumento de preço por banheiro adicional.

Por exemplo, se nossos pesos treinados forem [100, 10000, 15000], significa:

Cada metro quadrado adiciona $ 100 ao preço da casa.
Cada quarto acrescenta US$ 10.000 ao preço da casa.
Cada banheiro acrescenta US$ 15.000 ao preço da casa.

Modelos lineares, apesar de sua simplicidade, são ferramentas poderosas em aprendizado de máquina. Eles fornecem uma base para a compreensão de algoritmos mais complexos e oferecem insights interpretáveis sobre problemas do mundo real.

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/akdevelop/machine-learning-for-software-engineers-2hid?1 Se houver alguma violação, entre em contato com [email protected] para excluí-la

Tutorial mais recente Mais>

Como redirecionar vários tipos de usuários (alunos, professores e administradores) para suas respectivas atividades em um aplicativo Firebase?
RED: Como redirecionar vários tipos de usuário para as respectivas atividades compreender o problema e um aplicativo de votamento de que é...

Programação Postado em 2025-05-17
Como implementar eventos personalizados usando o padrão de observador em Java?
criando eventos personalizados em java eventos personalizados são indispensáveis em muitos cenários de programação, permitindo que os componen...

Programação Postado em 2025-05-17
Vários elementos pegajosos podem ser empilhados um no outro em CSS puro?
É possível ter vários elementos pegajosos empilhados um no outro em CSS puro? O comportamento desejado pode ser visto Aqui: https://webtheme...

Programação Postado em 2025-05-17
Encontre o método do elemento de script que atualmente executa o JavaScript
como fazer referência ao elemento de script que carregava o script atualmente executando compreendendo o problema em certos cenários, os desen...

Programação Postado em 2025-05-17
Como lidar com a entrada do usuário no modo exclusivo de tela cheia da Java?
manuseando a entrada do usuário no modo exclusivo da tela full em java introdução ao executar um aplicativo Java no modo exclusivo de tela c...

Programação Postado em 2025-05-17
Como definir dinamicamente as teclas em objetos JavaScript?
como criar uma chave dinâmica para uma variável de objeto JavaScript ao tentar criar uma chave dinâmica para um objeto JavaScript, usando essa s...

Programação Postado em 2025-05-17
$Resolva a exceção \\ "String Value \\" quando o MySQL insere emoji$
Resolva a exceção \\ "String Value \\" quando o MySQL insere emoji
Resolvando a exceção do valor da string incorreta ao inserir emoji ao tentar inserir uma string contendo caracteres emoji em um banco de dados M...

Programação Postado em 2025-05-17
Como inserir corretamente Blobs (imagens) no MySQL usando PHP?
Insira Blobs nos bancos de dados MySQL com PHP Ao tentar armazenar uma imagem no banco de dados A MySQL, você pode encontrar um problema. Est...

Programação Postado em 2025-05-17
Como inserir ou atualizar com eficiência linhas com base em duas condições no MySQL?
inserir ou atualizar com duas condições Problema Descrição: O usuário encontra um tempo de tempo que não está sendo inserido e de uma tabe...

Programação Postado em 2025-05-17
Qual é a diferença entre funções aninhadas e fechamentos em Python
funções aninhadas vs. fechamentos em python enquanto as funções aninhadas em python se assemelham superficialmente, e são fundamentalmente dis...

Programação Postado em 2025-05-17
Como implementar uma função de hash genérico para tuplas em coleções não ordenadas?
função de hash genérico para tuplas em coleções não ordenadas o std :: não -ordered_map e std :: uncomered_set contêineres fornecem pesquisa e...

Programação Postado em 2025-05-17
Como criar variáveis dinâmicas no Python?
Criação variável dinâmica em python A capacidade de criar variáveis dinamicamente pode ser uma ferramenta poderosa, especialmente ao trabalh...

Programação Postado em 2025-05-17
Como repetir com eficiência caracteres de string para recuo em C#?
repetindo uma string para o indentação Ao recuperar uma string com base na profundidade de um item, é conveniente ter uma maneira eficiente de...

Programação Postado em 2025-05-17
Como remover os manipuladores anônimos de eventos JavaScript de maneira limpa?
removendo os ouvintes anônimos do evento adicionando ouvintes de eventos anônimos a elementos fornece flexibilidade e simplicidade, mas quando é...

Programação Postado em 2025-05-17
Como corrigir “Erro geral: o servidor MySQL 2006 desapareceu” ao inserir dados?
Como resolver "Erro geral: o servidor MySQL de 2006 desapareceu" ao inserir registrosIntrodução:A inserção de dados em um banco de dados MyS...

Programação Postado em 2025-05-17

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo