Quais são os dados de entrada para o estudo de localização?

Qual é o assunto da pesquisa?

A análise de localização também é chamada de inteligência espacial, análise espacial ou análise geoespacial. Ela é uma intersecção entre business intelligence, análise geográfica e visualização de dados, e é utilizada, por exemplo, no Foursquare. Em um artigo publicado recentemente, pesquisadores investigaram como dados geoespaciais podem afetar o desempenho no varejo.

Uma boa localização frequentemente é a chave para o sucesso de uma loja, pois atrai consumidores, influencia a participação de mercado e a lucratividade. Alguns dos critérios usados na avaliação de um espaço comercial são informações geográficas, trânsito, acessibilidade da área, concorrência, distância, custos, segurança da região, aceitação local da companhia, densidade demográfica, dentre vários outros. Como identificar as características mais importantes? Ou, em outras palavras, o desempenho da loja atua em função de quais variáveis?

Pesquisadores já empregaram diversas técnicas para analisar as melhores localizações para o varejo. Algumas das técnicas mais comuns são modelos análogos, regressão e gravidade. O modelo análogo utiliza números de vendas de lojas parecidas para estimar o potencial de novos locais. O modelo de regressão recorre a um número de variáveis independentes para prever o resultado de uma variável dependente. Já o modelo de gravidade afirma que os clientes dentro de um raio específico da loja teriam impacto sobre suas vendas – ou seja, quanto maior o raio de distância dos clientes, mais insignificante é a influência na venda das lojas. Portanto, lojas de varejo geralmente estão localizadas perto de áreas residenciais.

Uma vez que esses modelos correm o risco de desconsiderar a heterogeneidade dos consumidores e segmentações do mercado, o estudo propõe a utilização de algoritmos para escolha da localização ideal. A discussão não é trivial, uma vez que vários erros importantes podem ocorrer durante essa escolha, tais como:

  • Falta de estudo das características importantes do local ou uso inapropriado dessas características na criação de um modelo preditivo;

  • Seleção de lugares excessivamente distantes;

  • Tomada de decisões baseadas em amostras inadequadas ou insuficientes;

  • Avaliação inadequada da concorrência.

Qual foi o método utilizado?

O estudo investigou características de 96 filiais de uma companhia de telecomunicação na Malásia. Os chamados algoritmos de seleção de características foram utilizados para identificação das variáveis mais importantes para predição de vendas. Esses algoritmos reduzem a quantidade de dados para análise, um processo de data mining importante, porque permite identificar os conjuntos de dados que podem ser usados na construção do modelo.

Seis conjuntos de dados foram utilizados:

  • 418.324 pontos de comércio da Malásia, divididos em 1232 categorias, e respectivas informações sobre tipo de negócio, endereço, latitude, longitude, entre outras;

  • Etnia da população segundo presença nas áreas mapeadas;

  • Atividade profissional;

  • Grau de escolaridade;

  • Tipo de residência (condomínio, apartamento, casa etc.);

  • Números de vendas das 96 filiais da companhia de telecomunicações.

Antes da analisar as características mais importantes para predição de vendas, o passo inicial foi transformar os dados não tratados em dados passíveis de análise – um processo também realizado com algoritmos. Em primeiro lugar, um algoritmo extraiu as latitudes e longitudes das 96 filiais da empresa de telecomunicação e seus respectivos números de vendas. Depois, um segundo algoritmo mapeou todas as lojas existentes nos arredores de cada filial, dentro de um diâmetro de 100m, como mostra a figura a seguir.

Um terceiro algoritmo analisou as 96 filiais segundo os conjuntos de dados levantados (etnia, atividade profissional, grau de escolaridade, tipo de residência e números de vendas) e procurou padrões dentro das mesmas cidades, regiões ou bairros. Um quarto algoritmo buscou prever qual seria o desempenho de vendas caso uma loja fosse instalada em um novo local – ele se baseou em todos os padrões identificados e buscou locais similares àqueles das filiais já existentes, de maneira a conseguir prever as vendas do novo local.

Uma vez que todos os dados foram tratados, os pesquisadores enfim rodaram cinco algoritmos de seleção de características, com o intuito de identificar as variáveis mais importantes na predição de vendas. São eles: Boruta, Recursive Feature Elimination (RFE), Feature Subset Computation (FSC), Random Forest (RF) e IG.

Resultados

As variáveis mais importantes na predição de vendas foram classificadas e os pesquisadores reportaram aquelas listadas com maior frequência nos diferentes algoritmos. Os experimentos mostraram que a principal variável preditora foram as atividades profissionais desenvolvidas na área onde se pretende instalar uma loja. Em seguida, as variáveis mais importantes são o grau de escolaridade das pessoas que vivem nos arredores e, na sequência, os tipos de residência existentes no local.

Desta maneira, o estudo confirmou que características da localização contribuem para a predição de vendas. Já o efeito da etnia foi descartado pela maioria dos algoritmos.

Embora os experimentos sejam baseados em informações de fora da realidade brasileira, ilustram de maneira interessante como podemos usar métodos de Data Science para predição de resultados de negócios.

O que são dados de localização?

Também conhecidos como informações geográficas e dados geoespaciais, os dados de localização consistem em informações relacionadas a objetos ou elementos presentes em um horizonte ou espaço geográfico. Existem dois tipos básicos de dados de localização: dados vetoriais e dados raster.

Quais os principais métodos utilizados para determinar a localização de uma fábrica?

Os principais métodos utilizados na aplicação das alternativas de Localização são: Método do Centro de Gravidade; Método de Classificação das Vantagens; Análise do Ponto de Estabilidade da Localização. Método do Centro de Custo; Método de Classificação das Vantagens; Análise do Ponto de Estabilidade da Localização.

O que é uma análise de localização?

A análise de localização é a prática de adicionar uma camada de dados geográficos aos ativos de dados de uma empresa para extrair informações mais valiosas. Às vezes é chamada de " geoanalítica ".

O que deve ser considerado ao escolher suas instalações?

O estudo para a localização das instalações deve ser realizado através da análise dessas variáveis e de outros quatro parâmetros que serão expostos nos próximos tópicos, tais como as características do produto, a capacidade de fabricação da indústria e as particularidades da rede de distribuição necessária.