Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Prévia do material em texto

<p>Manutenção Preditiva do Acoplamento Flexível de Turbinas Eólicas</p><p>(GE Renewable Energy)</p><p>Thiago Hussein Fantin (thiagohf@al.insper.edu.br)</p><p>Hugo Gonçalves Rocha (hugogr@al.insper.edu.br)</p><p>Gabriel Ulhôa de Avelar Scodiero (gabrieluas@al.insper.edu.br)</p><p>Trabalho de Conclusão de Curso</p><p>Relatório</p><p>Versão Final</p><p>do Projeto Final de Engenharia</p><p>São Paulo-SP</p><p>NOVEMBRO 2020</p><p>mailto:thiagohf@al.insper.edu.br</p><p>mailto:hugogr@al.insper.edu.br</p><p>mailto:gabrieluas@al.insper.edu.br</p><p>Gabriel Ulhoa de Avelar Scodiero</p><p>Hugo Gonçalves</p><p>Thiago Hussein Fantin</p><p>Manutenção Preditiva do Acoplamento Flexível de Turbinas Eólicas</p><p>(GE Renewable Energy)</p><p>Relatório Final do Projeto Final de Engenharia</p><p>Relatório apresentado ao curso de Engenharia, como requisito</p><p>para o Trabalho de Conclusão de Curso.</p><p>Professor Orientador: Prof. Fabiano Daher Adegas</p><p>Mentor na Empresa: Alexandre Badem</p><p>Coordenador TCC/PFE: Prof. Dr. Luciano Pereira Soares</p><p>São Paulo - SP</p><p>NOVEMBRO 2020</p><p>Thiago Hussein Fantin</p><p>Hugo Gonçalves Rocha</p><p>Gabriel Ulhôa de Avelar Scodiero</p><p>Manutenção Preditiva do Acoplamento Flexível de Turbinas Eólicas</p><p>(GE Renewable Energy)</p><p>Projeto Final de Engenharia apresentado ao</p><p>programa Graduação em Engenharia</p><p>(Computação/Mecânica/Mecatrônica) como</p><p>requisito parcial para a obtenção do título de</p><p>Bacharel em Engenharia.</p><p>Orientador: Prof. Fabiano Daher Adegas</p><p>Banca Examinadora</p><p>______________________________________</p><p>Fabiano Daher Adegas</p><p>Insper - Instituto de ensino e pesquisa</p><p>______________________________________</p><p>Raphael Galdino dos Santos</p><p>Insper - Instituto de ensino e pesquisa</p><p>______________________________________</p><p>Vinicius Licks</p><p>Insper - Instituto de ensino e pesquisa</p><p>RESUMO</p><p>Atualmente, a manutenção preditiva vem sendo adotada por empresas dos mais diversos</p><p>segmentos. Poder prever falhas antes que as mesmas ocorram e diminuir o número de inspeções</p><p>preventivas nas turbinas é economicamente vantajoso, além de auxiliar na estruturação de um</p><p>cronograma de manutenção adequado. Visando isto, este projeto tem como tema a</p><p>implementação de um algoritmo para detecção de anomalia e possíveis falhas nos acoplamentos</p><p>flexíveis das turbinas eólicas da empresa General Electric Renewable Energy (GE).</p><p>Para isto, foi implementado um classificador de classe única por SVM (SVM One-Class</p><p>Classifier) alimentado com 110 arquivos de dados de vibração referentes a 6 turbinas saudáveis</p><p>fornecidas pela própria General Electric Renewable Energy. O algoritmo teve como objetivo</p><p>utilizar os dados obtidos pelas turbinas em funcionamento saudável para gerar uma “fronteira”</p><p>para os valores normais de vibração. Possíveis anomalias seriam consideradas outliers e</p><p>indicadas como tal. Uma vez treinado, o desempenho do classificador foi validado utilizando</p><p>37 arquivos com dados referentes às mesmas 6 turbinas saudáveis e 6 arquivos com dados</p><p>referentes a 5 turbinas defeituosas, obtendo uma acurácia de 97,30% no primeiro grupo e 100%</p><p>no segundo grupo. O algoritmo foi desenvolvido no software MATLAB_R2020b.</p><p>Sumário</p><p>RESUMO ................................................................................................................................... 3</p><p>1. Introdução ..................................................................................................................... 5</p><p>1.1. Escopo do projeto.......................................................................................................... 6</p><p>1.2. Recursos ........................................................................................................................ 6</p><p>1.3. Cronograma e divisão de tarefas ................................................................................... 7</p><p>1.4. Mapeamento dos stakeholders .................................................................................... 11</p><p>1.5. Riscos Envolvidos ....................................................................................................... 12</p><p>2. Revisão do Estado da Arte .......................................................................................... 14</p><p>3. Contextualização e Entendimento do problema .......................................................... 17</p><p>3.1. Estrutura ...................................................................................................................... 17</p><p>3.2. Modos de falha ............................................................................................................ 19</p><p>4. Business Case .............................................................................................................. 19</p><p>5. Dados .......................................................................................................................... 26</p><p>6. Metodologia e Resultados ........................................................................................... 31</p><p>6.1. “Treinamento_e_Análise.mlx” ................................................................................... 33</p><p>6.1.1. Leitura de arquivos...................................................................................................... 33</p><p>6.1.2. Definição dos indicadores de condição ....................................................................... 34</p><p>6.1.3. Construção PCA .......................................................................................................... 40</p><p>6.1.4. Implementação PCA ................................................................................................... 41</p><p>6.1.5. Construção Classificador ............................................................................................ 43</p><p>6.2. “Usuário_e_Teste.mlx” ............................................................................................... 45</p><p>6.2.1. Leitura arquivos .......................................................................................................... 46</p><p>6.2.2. Extração indicadores de condição ............................................................................... 46</p><p>6.2.3. Implementação PCA ................................................................................................... 47</p><p>6.2.4. Previsão Classificador ................................................................................................. 48</p><p>7. Conclusões e trabalhos futuros ................................................................................... 50</p><p>Referências ............................................................................................................................... 52</p><p>Apêndice ................................................................................................................................... 54</p><p>Anexo........................................................................................................................................54</p><p>1. Introdução</p><p>A General Electric (GE) é um conglomerado multinacional estadunidense, com base na</p><p>cidade de Boston, em Massachussets, que atua em setores como biotecnologia, aviação,</p><p>manufatura aditiva, energético (tanto fontes convencionais como fontes renováveis), entre</p><p>outros. Fundada em 1892 pela fusão das empresas Edison General Electric Company e</p><p>Thomson-Houston Company, a GE atualmente possui forte presença em mais de 170 países e</p><p>foi listada como a terceira empresa dos EUA com maior receita bruta em 2017 [1][2].</p><p>Um dos principais produtos da GE no setor de energia renovável (GE Renewable</p><p>Energy) são turbinas eólicas. Em 2017, existiam mais de 35.000 turbinas eólicas fabricadas pela</p><p>GE instaladas em todo o planeta. Para garantir uma alta produção de energia, é necessário que</p><p>as turbinas estejam em pleno funcionamento durante o maior período</p><p>ser calculada.</p><p>Por último, uma adição interessante ao projeto, seria o estudo dos resultados para</p><p>diagnóstico, ou seja, conseguir determinar a causa da falha. Tal adição poderia ser realizado</p><p>por uma clusterização acompanhado de uma análise física dos resultados. Tais trabalhos futuros</p><p>podem ser abordados na disciplina optativa de PFE Avançado lecionada no Insper, por outros</p><p>grupos que queiram dar continuidade ao projeto ou mesmo pela própria empresa (GE), para</p><p>refinar e melhorar o produto final.</p><p>Alguns passos são sugeridos antes da implementação deste projeto no dia a dia da</p><p>empresa. Primeiramente a coleta de mais dados saudáveis e defeituosos para calcular de</p><p>maneira mais precisa o valor da acurácia e assim possibilitar a empresa traçar sua estratégia.</p><p>Em seguida, testes do algoritmo com máquinas que apresentem alguma falha, mas que ainda</p><p>estejam funcionando, para fazer um paralelo com o sucesso do algoritmo. Por último, a</p><p>implementação de uma captação de dados com regularidade, para que possa ser feita a</p><p>integração do algoritmo com o sistema SCADA e então funcionar de maneira mais autônoma.</p><p>1 São consideradas máquinas saudáveis, turbinas que tenham passado por uma inspeção</p><p>recente e nenhuma anomalia foi detectada.</p><p>52</p><p>Referências</p><p>[1] https://www.ge.com/</p><p>[2] https://www.ge.com/renewableenergy/</p><p>[3] Qiao, W.; Qu, L. Prognostic Condition Monitoring for Wind Turbine Drivetrains via</p><p>Generator Current Analysis, 2018, NE 68588-0511.</p><p>[4] Breteler, D.; Kaidis, C.; Tinga, T.; Loendersloot, R. Physics based methodology for wind</p><p>turbine failure detection, diagnostics & prognostics, 2015.</p><p>[5] Asgarpour, M.; Sørensen, J. D. Bayesian based Prognostic Model for Predictive</p><p>Maintenance of Offshore Wind Farms, 2018.</p><p>[6] Li, N.; Lei, Y.; Lin, J.; Ding, S.X. An Improved Exponential Model for Predicting</p><p>Remaining Useful Life of Rolling Element Bearings. IEEE Trans. Ind. Electron. 2015, 62,</p><p>7762–7773.</p><p>[7] Wu, J.; Wu, C.; Cao, S.; Or, S.W.; Deng, C.; Shao, X. Degradation Data-Driven Time-To-</p><p>Failure Prognostics Approach for Rolling Element Bearings in Electrical Machines. IEEE</p><p>Trans. Ind. Electron. 2018, 66, 529–539</p><p>[8] Loukopoulos, P.; Zolkiewski, G.; Bennett, I.; Sampath, S.; Pilidis, P.; Li, X.; Mba, D.</p><p>Abrupt fault remaining useful life estimation using measurements from a reciprocating</p><p>compressor valve failure. Mech. Syst. Signal Process. 2019, 121, 359–372.</p><p>[9] Zhang, S.; Ganesan, R.; Xistris, G. Self-organising neural networks for automated</p><p>machinery monitoring systems. Mech. Syst. Signal Process. 1996, 10, 517–532.</p><p>[10] Escaler, X.; Mebarki, T.Full-Scale Wind Turbine Vibration Signature Analysis, 2018.</p><p>[11] MathWorks, Inc. Wind Turbine High-Speed Bearing Prognosis, 2018.</p><p>[12] MathWorks, Inc.Update RUL Prediction as Data Arrives, 2018.</p><p>[13] MathWorks, Inc. exponentialDegradationModel, 2020.</p><p>[14] Elasha, F.; Suliman S.; Xiaochun L.; Mba D. Prognosis of a Wind Turbine Gearbox</p><p>Bearing Using Supervised Machine Learning, 2019.</p><p>53</p><p>[15] R. Perdisci, G. Gu and W. Lee, "Using an Ensemble of One-Class SVM Classifiers to</p><p>Harden Payload-based Anomaly Detection Systems," Sixth International Conference on Data</p><p>Mining (ICDM'06), Hong Kong, 2006, pp. 488-498.</p><p>[16] Shyu, M.; Chen, S.; Sarinnapakorn, K.; Chang, L. A Novel Anomaly Detection Scheme</p><p>Based on Principal Component Classifier, 2006.</p><p>[17] Erfani, S.; Rajasegarar, S.; Karunasekera, S.; Leckie, C. High-dimensional and large-scale</p><p>anomaly detection using a linear one-class SVM with deep learning, 2016.</p><p>[18] Géron, A. (2017). Hands-on Machine Learning with Scikit Learn & TensorFlow: concepts,</p><p>tools, and techniques to build intelligent systems. O’Reilly.</p><p>54</p><p>A pasta “PFE” referida no Apêndice e no Anexo pode ser encontrada no link a seguir ou no</p><p>“Box” disponibilizado pela GE.</p><p>https://alinsperedu-</p><p>my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT</p><p>_tDKdA7QV35WuQs8IQ</p><p>Apêndice</p><p>Apêndice A – https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p</p><p>Apêndice B – https://plan.toggl.com/#pg/tBg4SadI-DL7R7vVeZpJDhQbMDFDlSK8</p><p>Apêndice C – PFE/Apendices/Pre_Processamento_Arquivos_Arpex.mlx</p><p>Apêndice D – PFE/Apendices/Pre_Processamento_Arquivos_Foco.mlx</p><p>Apêndice E – PFE/Apendices/Pre_Processamento_Arquivos_Defeituosos.mlx</p><p>Apêndice F – PFE/Apendices/Sep_Teste_Treino.mlx</p><p>Apêndice G – PFE/Apendices/Treinamento_e_analise.mlx</p><p>Apêndice H – PFE/Apendices/Usuario_e_Teste.mlx</p><p>Apêndice I – PFE/Apendices/Graficos</p><p>Apêndice J – PFE/Apendices/ PCAs_E_PKS_saud.mat</p><p>Anexo</p><p>Anexo A – PFE/Anexos/Antes_Pre_Processamento</p><p>Anexo B – PFE/Anexos /Pos_Processado/Arpex</p><p>Anexo C – PFE/Anexos /Pos_Processado/Defeituosas</p><p>Anexo D – PFE/Anexos/Antes_Pre_Processamento/KTR</p><p>https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ</p><p>https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ</p><p>https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ</p><p>https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p</p><p>https://plan.toggl.com/#pg/tBg4SadI-DL7R7vVeZpJDhQbMDFDlSK8</p><p>de tempo possível.</p><p>Entretanto, eventuais falhas nos componentes mecânicos podem gerar paradas para</p><p>manutenção, interrompendo o funcionamento da turbina e sua geração de energia. Devido aos</p><p>esforços mecânicos cíclicos ao qual está submetido, uma das peças mais propensas à falha por</p><p>fadiga é o acoplamento flexível, que tem a função de compensar leves desalinhamentos na</p><p>montagem entre a caixa multiplicadora e o gerador da turbina.</p><p>A anomalia do acoplamento flexível (aqui denominada liberation) causa grandes</p><p>prejuízos para a empresa, já que quando ocorre pode danificar outras peças. Para evitar este</p><p>problema, é interessante para a empresa ter o conhecimento do estado das turbinas, de modo a</p><p>fazer a manutenção preventiva (ou seja, antes que o liberation ocorra) e não apenas corretiva</p><p>(apenas após a falha). Além disso, com a prevenção de anomalias e a diminuição do número de</p><p>inspeções preventivas, projeta-se obter uma economia relativamente alta em 10 anos de</p><p>aplicação. Com isto em mente, o objetivo é desenvolver um algoritmo de detecção de anomalias</p><p>no acoplamento flexível com o intuito de detectá-las antes que elas causem um dano maior à</p><p>turbina. Para isto, foram utilizados 110 arquivos com dados obtidos nos sensores de vibração</p><p>de 6 turbinas saudáveis para treinar um classificador de classe única por SVM (SVM One-Class</p><p>Classifier). Os dados foram fornecidos pela própria GE. O intuito do classificador é delimitar</p><p>uma “fronteira” dentro da qual os indicadores de condição (aqui tidos como combinações de</p><p>dados dos sensores obtidos pelo algoritmo de Principal Component Analysis – PCA) são</p><p>considerados saudáveis. Eventuais outliers, portanto, indicariam uma tendência de falha da</p><p>turbina. O classificador descrito neste projeto utilizou 37 arquivos com dados referentes às</p><p>mesmas 6 turbinas saudáveis e 6 arquivos com dados referentes a 5 turbinas defeituosas para</p><p>6</p><p>validação, obtendo acurácia de 97,30% no primeiro grupo e 100% no segundo. Os algoritmos</p><p>foram programados em MATLAB.</p><p>1.1. Escopo do projeto</p><p>Dentro do Escopo (In-Scope):</p><p>• Algoritmos de detecção anomalia do</p><p>acoplamento flexível de turbinas</p><p>eólicas a partir de dados obtidos em</p><p>falhas passadas e turbinas operando</p><p>de maneira saudável.</p><p>• Quantificação da severidade da</p><p>anomalia.</p><p>• Documentação do algoritmo.</p><p>Fora do Escopo (Out-of-Scope):</p><p>• Determinar em quanto tempo a</p><p>turbina irá falhar (RUL).</p><p>• Determinar a causa da falha.</p><p>• Medidas reparativas nas turbinas.</p><p>• Implementação do algoritmo com</p><p>sistema SCADA utilizado pela</p><p>empresa.</p><p>• Não funcionará em Nuvem.</p><p>Um algoritmo de detecção de anomalia neste caso define-se como um programa que</p><p>utiliza machine learning para determinar o quão saudável uma turbina é baseado nos</p><p>indicadores de saúde tanto de turbinas saudáveis quanto de turbinas defeituosas.</p><p>A determinação da RUL (Remaining Useful Life), bem como a classificação da causa</p><p>da falha poderão ser abordadas posteriormente, em novos estudos ou até mesmo na disciplina</p><p>optativa de PFE Avançado, lecionada no Insper. A programação se dará em ambiente</p><p>MATLAB_R2020b.</p><p>1.2. Recursos</p><p>Os principais recursos humanos utilizados nesse projeto são: Treinamento dos</p><p>integrantes, em relação aos assuntos tratados no projeto, para conseguir obter os resultados</p><p>desejados, assim como o tempo desses mesmos integrantes. Contato constante com a</p><p>organização, GE Renewable Energy, para sanar qualquer tipo de dúvida e adquirir dados e</p><p>conhecimento. Tempo e conhecimento do orientador para ajudar o desenvolvimento do projeto.</p><p>Os demais recursos utilizados são: Toggle Plan, como ferramenta de gerenciamento do projeto.</p><p>Para armazenamento de informações e grandes quantidades de dados, um repositório,</p><p>disponibilizado pela própria GE. MATLAB_R2020b, para analisar os dados e processá-los,</p><p>assim como auxiliar no desenvolvimento dos algoritmos. Pacote Office 365, para redigir</p><p>relatório e auxiliar em apresentações necessárias.</p><p>7</p><p>1.3. Cronograma e divisão de tarefas</p><p>Para planejar o projeto, um cronograma foi feito. Abaixo é possível ver uma primeira</p><p>idealização do cronograma e divisão de tarefas e em seguida o cronograma e divisão de tarefas</p><p>que foi seguido ao final do projeto. É possível ver que há diferenças marcantes entre os dois</p><p>pois a idealização do projeto sofreu bastante alteração com seu avanço. Uma versão interativa</p><p>desse cronograma final pode ser encontrado no Apêndice A. O Apêndice B mostra com mais</p><p>detalhes a divisão de tarefas entre os membros do grupo.</p><p>Figura 1 – Cronograma estipulado no início do planejamento</p><p>(Fonte: Elaborado pelo autor)</p><p>9</p><p>Figura 2 – Cronograma realizado durante o projeto.</p><p>(Fonte: https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p)</p><p>https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p</p><p>Tabela 1– Divisão de tarefas principais, estipulada no início do planejamento.</p><p>Algoritmo #1 Responsável Algoritmo #2 Responsável</p><p>Captar dados Gabriel Captar dados Thiago</p><p>PCA Hugo 1º PCA Thiago</p><p>Detectar range saudável Gabriel Árvores de regressão Hugo</p><p>Exponencial e RUL Gabriel Resíduos Hugo</p><p>Teste completo Hugo 2º PCA Thiago</p><p>Clusterização Gabriel Exponencial e RUL Gabriel</p><p>Diagnóstico Thiago Teste completo Thiago</p><p>- - Clusterização Hugo</p><p>- - Diagnóstico Thiago</p><p>(Fonte: Elaborado pelo autor)</p><p>Tabela 2– Divisão de tarefas principais, realizada durante o projeto.</p><p>Gerais Responsável Algoritmo Responsável</p><p>Análise de riscos Hugo Coleta de dados Gabriel</p><p>Definição escopo Hugo Ler e tabelar dados Gabriel</p><p>Definição requisitos Thiago</p><p>Seleção indicadores de</p><p>condição</p><p>Gabriel</p><p>Entendimento do</p><p>problema</p><p>Thiago PCA Hugo</p><p>Análise dos dados</p><p>disponíveis</p><p>Gabriel Classificador Hugo</p><p>Idealização da abordagem Gabriel Código usuário</p><p>Gabriel e</p><p>Hugo</p><p>Pesquisa projetos</p><p>similares</p><p>Hugo Documentação código Gabriel</p><p>Cronograma Gabriel Teste e validação Gabriel</p><p>Business Case Thiago - -</p><p>(Fonte: Elaborado pelo autor)</p><p>11</p><p>1.4. Mapeamento dos stakeholders</p><p>Tabela 3– Mapeamento stakeholders.</p><p>Stakeholder Posição Papel no Projeto Expectativas</p><p>Rodrigo Minari</p><p>Engenheiro</p><p>Eletricista</p><p>Fornecimento de</p><p>informações mais</p><p>gerais da empresa</p><p>e do problema,</p><p>assim como guia</p><p>do produto final</p><p>desejado. Um algoritmo de detecção de</p><p>anomalia funcional, que classifique as</p><p>turbinas entre saudáveis e defeituosas</p><p>e que forneça um score, que indicará o</p><p>quão grande é a anomalia naquela</p><p>turbina. É importante para o</p><p>stakeholder que a solução apresente</p><p>uma acurácia elevada, que compense</p><p>os esforços de checagem da turbina.</p><p>Rafael Lima</p><p>Engenheiro</p><p>Mecânico</p><p>Fornecimento de</p><p>informações mais</p><p>gerais dos</p><p>problemas e</p><p>análises.</p><p>Alexandre</p><p>Badem</p><p>Engenheiro</p><p>Mecânico</p><p>Sênior</p><p>Fornecimento de</p><p>dados das turbinas</p><p>e definição de</p><p>características da</p><p>solução que se</p><p>adequem a</p><p>empresa.</p><p>Morales Ortiz</p><p>Engenheiro</p><p>Eletrônico</p><p>Fornecimento de</p><p>informações mais</p><p>especificas das</p><p>turbinas e contato</p><p>mais direto com as</p><p>mesmas.</p><p>.</p><p>É particularmente interessante para</p><p>este stakeholder que o algoritmo seja</p><p>prático e de fácil utilização em campo.</p><p>Lucas Perrucci</p><p>Engenheiro</p><p>Mecânico</p><p>Sênior</p><p>Fornecimento de</p><p>dados das turbinas</p><p>e definição de</p><p>características da</p><p>solução que se</p><p>adequem a</p><p>empresa.</p><p>Um algoritmo de detecção de</p><p>anomalia funcional, que classifique as</p><p>turbinas entre saudáveis e defeituosas</p><p>e que forneça um score, que indicará o</p><p>quão grande é a anomalia naquela</p><p>turbina. É importante para o</p><p>stakeholder que o algoritmo apresente</p><p>uma acurácia elevada, que compense</p><p>os esforços de checagem da turbina.</p><p>12</p><p>Fabiano Adegas Orientador</p><p>Fornecimento de</p><p>informações e</p><p>conteúdo para</p><p>desenvolver o</p><p>projeto, assim</p><p>como uma</p><p>orientação durante</p><p>todo o processo.</p><p>O stakeholder espera um trabalho</p><p>coeso, organizado, bem documentado</p><p>e apresentável para empresa, bem</p><p>como</p><p>para a banca. Assim como</p><p>Desenvolvimento das competências</p><p>(Objetivos de Aprendizado) do time.</p><p>Luciano Soares</p><p>Coordenador</p><p>do PFE</p><p>Fornecimento de</p><p>informações e</p><p>orientações mais</p><p>gerais em relação</p><p>ao PFE.</p><p>(Fonte: Elaborado pelo autor)</p><p>1.5. Riscos Envolvidos</p><p>Os principais riscos encontrados em nosso projeto foram relacionados a dados e</p><p>complexidade. A dificuldade de obter os dados ou não os obter, poderia ter um grande impacto</p><p>no projeto, fazendo com que tenhamos que tomar caminhos diferentes, como por exemplo</p><p>instalação de sensores, para superar este problema. Outro risco relacionado aos dados é de não</p><p>sermos capazes de detectar uma separação entre dados saudáveis e defeituosos, impedindo êxito</p><p>do projeto em detectar anomalias. Ainda falando dos dados, é possível que os dados obtidos</p><p>tenham uma confiabilidade baixa e não sejam adequados para uma análise preditiva. Além</p><p>disso, a idealização de um projeto muito complexo pode dificultar a conclusão do projeto no</p><p>tempo determinado. Por último, o risco relacionado à falta de retorno financeiro do projeto</p><p>também é de extrema relevância. Um projeto que não obtenha resultados adequados inviabiliza</p><p>a obtenção de investimentos para o seu desenvolvimento.</p><p>13</p><p>Tabela 4– Tabela de riscos.</p><p>Risco Plano de mitigação Resultado</p><p>Dificuldade de obter os</p><p>dados.</p><p>Analisar os dados que serão</p><p>necessários para o projeto e</p><p>requisitá-los prontamente à</p><p>empresa.</p><p>O plano de mitigação foi</p><p>devidamente implementado</p><p>e não houve problemas para</p><p>obter os dados.</p><p>Impossibilidade de detectar</p><p>uma separação clara entre</p><p>dados saudáveis e</p><p>defeituosos.</p><p>Analisar sinais de diversos</p><p>sensores buscando</p><p>diferenças claras e fusão de</p><p>dados por meio do algoritmo</p><p>de PCA.</p><p>Obteve-se por análise</p><p>variáveis que demonstram</p><p>claramente a diferença entre</p><p>defeituoso e saudável.</p><p>Baixa confiabilidade dos</p><p>dados.</p><p>Utilizar dados de uma</p><p>quantidade significativa de</p><p>turbinas. Para os dados</p><p>saudáveis, utilizar turbinas</p><p>que foram inspecionadas</p><p>recentemente</p><p>O plano de mitigação foi</p><p>implementado e foram</p><p>obtidos dados de boa</p><p>confiabilidade de turbinas</p><p>saudáveis. Já as defeituosas</p><p>não há uma alta</p><p>confiabilidade pois existem</p><p>muitos poucos dados</p><p>disponíveis.</p><p>Idealização de algo muito</p><p>complexo.</p><p>Conversar com o professor</p><p>orientador sempre que uma</p><p>decisão importante for ser</p><p>tomada ou haja uma</p><p>alteração de rumo.</p><p>O escopo do projeto foi</p><p>debatido com a empresa e</p><p>com o professor orientador</p><p>diversas vezes e sua versão</p><p>final é um projeto que</p><p>cumpre suas premissas e está</p><p>dentro da capacidade técnica</p><p>e dos prazos do PFE.</p><p>Falta de retorno financeiro</p><p>com o projeto</p><p>Desenvolver um</p><p>planejamento e uma etapa de</p><p>avaliação de projeto, para</p><p>obter projeções de valores de</p><p>retorno.</p><p>Obtiveram-se valores reais e</p><p>de extrema relevância para a</p><p>empresa, com economias de</p><p>mais de R$100.000.000,00</p><p>em 10 anos.</p><p>(Fonte: Elaborado pelo autor)</p><p>14</p><p>2. Revisão do Estado da Arte</p><p>Com a expansão das turbinas eólicas como alternativa de fonte de energia renovável,</p><p>algoritmos de prognóstico de falha para as mesmas estão sendo cada vez mais estudadas. De</p><p>acordo com [3], isso se deve ao fato de que turbinas eólicas tendem a apresentar falhas com</p><p>maior frequência em relação ao maquinário utilizado por outras fontes, como termal e</p><p>hidrelétrica, devido ao ambiente mais hostil, onde as condições de operação variam muito. Com</p><p>isso, muitos métodos de análise foram estudados e implementados para a resolução deste</p><p>problema.</p><p>No campo de estudo de Machine Learning aplicada a contexto de prognóstico e detecção</p><p>de falha de máquinas, estudos relativos à dois modelos têm sido recorrentes. O primeiro, de</p><p>prognóstico propriamente dito, busca aplicar modelos de machine learning para prever em</p><p>quanto tempo determinado componente de uma máquina irá falhar baseado em dados sobre a</p><p>degradação do mesmo [14]. Já o segundo grupo de modelos, ainda pouco utilizado no contexto</p><p>industrial, porém muito utilizado em redes de computadores, diz respeito ao treinamento de</p><p>algoritmos detectores de anomalias, que ao invés de tentarem prever o tempo no qual o</p><p>componente vai falhar, tentam detectar comportamentos anômalos geralmente por comparação</p><p>com dados saudáveis [15].</p><p>Começando pelo primeiro grupo, em [4] são classificados os modelos de prognóstico</p><p>em turbinas eólicas entre estatísticos ou orientados por dados (data-driven). Segundo os autores,</p><p>os modelos estatísticos têm como desvantagem não levar em conta as condições atuais do</p><p>sistema, o que no limite pode resultar em predições de falha posteriores à falha real. Já os</p><p>modelos orientados por dados possuem uma boa predição, mas em geral não são capazes de</p><p>acusar o motivo da falha. Uma terceira abordagem seria utilizar princípios físicos do</p><p>funcionamento da turbina, implementá-los juntamente com um dos métodos anteriores, para</p><p>chegar em um resultado acurado e que indique a possível razão da falha. De fato, em [5] os</p><p>autores veem como uma melhoria de seu modelo estatístico a inserção de algum princípio físico</p><p>ao analisarem a degradação de componentes de turbinas eólicas onshore1.</p><p>Por se tratar de uma máquina rotativa, a análise espectral [de sinais de vibração] pode</p><p>acusar anomalias ligadas à futuras falhas. Diversos algoritmos estatísticos foram empregados</p><p>para criar um algoritmo de prognóstico que utilizam características da análise espectral. Em [6]</p><p>é aplicado um modelo de regressão exponencial aos dados de vibração de rolamentos para</p><p>determinar a vida útil remanescente (RUL) dos mesmos. Da mesma forma, em [7] é utilizado</p><p>um modelo de regressão exponencial e também aplica um algoritmo empírico bayesiano. Em</p><p>[8] são utilizadas várias técnicas de machine learning, dentre as quais estão as regressões linear</p><p>15</p><p>e polinomial para determinar a RUL de uma válvula de compressor. Algoritmos mais robustos,</p><p>como redes neurais, também foram utilizados em [9], embora que para outro tipo de</p><p>maquinário.</p><p>Uma alternativa ao uso de dados de vibração pode ser estudada em [3]. Os autores</p><p>utilizam dados elétricos do gerador da turbina para detectar as falhas, o que apresenta algumas</p><p>vantagens como a facilidade de medição dos dados e a economia no gasto com hardwares e</p><p>sensores, uma vez que os sinais do gerador já são captados pelas malhas de controle. Por outro</p><p>lado, algumas desvantagens desse método também são citadas, como os SNR (signal-to-noise</p><p>ratios) baixos, que podem fazer com que sinais relevantes sejam confundidos com ruído</p><p>externo. Além disso, ao se utilizar os dados no domínio da frequência, algumas frequências de</p><p>falha tendem a se sobrepor.</p><p>Entretanto, como visto nos atuais estudos sobre o tema, para as análises de prognóstico</p><p>uma grande quantidade de dados se faz necessária e é preciso que estes dados sejam obtidos ao</p><p>longo de um determinado tempo, para que a degradação gradual do maquinário seja percebida.</p><p>Os dados disponibilizados para este estudo são da ordem de minutos antes da falha, o que</p><p>inviabiliza a aplicação de modelos para determinar a RUL, por exemplo. Além disso, tem-se</p><p>muitos dados de operação de turbinas saudáveis e poucos dados de falha, o que comprometeria</p><p>o classificador, que não conseguiria reconhecer bem uma falha. Estes fatores tornam os modelos</p><p>de prognóstico difíceis de serem implementados no contexto deste projeto.</p><p>Além dos algoritmos de prognóstico, o outro emprego de machine learning para</p><p>predição de falhas que vem sido estudado são os chamados detectores de anomalia. Os</p><p>detectores de anomalia têm sido usados em diversos contextos. Em [15] os autores discorrem</p><p>sobre o uso de um classificador de classe única pelo método da SVM (Support Vector Machine)</p><p>para implementação de um IDS (Intruder Detection System) para detectar anomalias em redes</p><p>de computadores, no qual os dados de entrada do classificador</p><p>são acessos considerados</p><p>“normais” na rede. Em [16] é proposta a aplicação do algoritmo de PCA para treinar um</p><p>classificador de outliers em um mesmo contexto de detecção de intrusos. Em [17] os autores</p><p>fazem a aplicação de um classificador de classe única SVM num contexto de detecção de</p><p>outliers em IoT, usando algoritmo de DBN (Deep Belief Network) para redução de</p><p>dimensionalidade, ao invés da aplicação do algoritmo de PCA.</p><p>Diferentemente dos modelos de prognóstico, os modelos de detecção de anomalia</p><p>utilizam dados considerados saudáveis para treinamento, assim como é necessário para o</p><p>problema proposto pela GE. Com isto em mente, este estudo se propõe a criar um algoritmo</p><p>classificador que use dados de vibração saudáveis e reconheça outliers, sendo assim um detector</p><p>16</p><p>de anomalias. Como visto, o modelo de classificador de classificação única por SVM é</p><p>amplamente utilizado para isso, mas no contexto de redes de computadores. Até onde foi</p><p>possível investigar, a sua aplicação em detecção de falhas no maquinário de turbinas eólicas é</p><p>uma contribuição original deste trabalho. O uso de outros métodos de Machine Learning são</p><p>justificados na metodologia conforme forem citados.</p><p>17</p><p>3. Contextualização e Entendimento do problema</p><p>3.1. Estrutura</p><p>A obtenção de uma solução que atenda os requisitos da empresa transcorre pelo</p><p>entendimento do problema, ou seja, da causa da falha e da estrutura física de turbinas eólicas.</p><p>De forma simplificada, a turbina é composta por um conjunto de pás, que se conectam</p><p>ao eixo de baixa velocidade de rotação. A partir do acoplamento flexível, é conectado um eixo</p><p>de menor diâmetro que se ligará à uma caixa de transmissão, que promove uma maior</p><p>velocidade de rotação. Este eixo se liga à uma caixa de transmissão que converterá uma rotação</p><p>de aproximadamente 16,7 rpm para aproximadamente 1500 rpm, possibilitando a geração de</p><p>energia pelo gerador.</p><p>Figura 3 – Design estrutural turbina eólica</p><p>(Fonte: CENTRO BRASILEIRO DE ENERGIA EÓLICA – CBEE / UFPE. 2000. Disponível em:</p><p>www.eolica.com.br.)</p><p>18</p><p>O acoplamento flexível é o componente responsável por compensar eventuais</p><p>desalinhamentos na montagem entre os dois eixos da turbina. Uma de suas extremidades se</p><p>conecta ao eixo de baixa rotação da turbina, referente às pás. A outra se conecta ao eixo de alta</p><p>rotação, referente à caixa de transmissão. Essas duas extremidades se conectam a partir de um</p><p>cilindro de fibra de vidro, que oferece a flexibilidade necessária para compensar os eventuais</p><p>desalinhamentos entre os eixos. Além disso, existe um conjunto de chapas metálicas, nomeadas</p><p>como flex packs (Figura 4), nos pontos de conexão com os eixos, que também auxiliam nesta</p><p>flexibilidade, mas também garantem a resistência do conjunto.</p><p>Figura 4 – Análise tensão flex pack.</p><p>(Fonte: GE Renewables)</p><p>Figura 5 – Acoplamento flexível</p><p>(Fonte: https://www.windpowerengineering.com/challenges-couplings-torque-limiters-face-wind-</p><p>turbines/#:~:text=The%20torque%20limiter%20and%20composite,continues%20in%20the%20forward%20dire</p><p>ction</p><p>https://www.windpowerengineering.com/challenges-couplings-torque-limiters-face-wind-turbines/#:~:text=The%20torque%20limiter%20and%20composite,continues%20in%20the%20forward%20direction</p><p>https://www.windpowerengineering.com/challenges-couplings-torque-limiters-face-wind-turbines/#:~:text=The%20torque%20limiter%20and%20composite,continues%20in%20the%20forward%20direction</p><p>https://www.windpowerengineering.com/challenges-couplings-torque-limiters-face-wind-turbines/#:~:text=The%20torque%20limiter%20and%20composite,continues%20in%20the%20forward%20direction</p><p>19</p><p>3.2. Modos de falha</p><p>Suprimido a pedido da General Electric.</p><p>20</p><p>4. Business Case</p><p>A proposta do projeto visa detectar anomalias relacionadas ao rompimento completo do</p><p>flex pack do acoplamento flexível de modelo Arpex, ocasionando a quebra de outros</p><p>equipamentos da turbina. A empresa utiliza como método de prevenção de falhas reativas a</p><p>checagem física da estrutura, a variação no gráfico de aceleração da turbina pela velocidade do</p><p>vento e pela variação da relação entre os eixos de baixa e alta rotação.</p><p>A empresa adota diferentes tipos de contrato com os seus clientes, porém em grande</p><p>parte dos contratos, o custo de oportunidade relacionado à interrupção das turbinas está</p><p>relacionado a uma multa à empresa se o tempo disponível para produção de energia esteja</p><p>abaixo de 95% do tempo total de contrato. Portanto, por este fator estar atrelado à diferentes</p><p>contratos e a multa também ser variável, não será considerado no projeto. Três cenários de</p><p>interrupção da geração de energia das turbinas foram elencados pela equipe da empresa.</p><p>O primeiro deles está relacionado à troca apenas dos dois flex packs presentes no</p><p>sistema. Esta troca demanda seis horas de interrupção e a presença de dois técnicos, além do</p><p>valor da própria peça, que pode ser visto na tabela abaixo.</p><p>Tabela 5 – Custos relacionados à troca dos Flex Packs</p><p>FLEX PACK 2 unidades</p><p>Custo por FLEX PACK [BRL] R$6.513,98</p><p>Técnicos necessários 2</p><p>Custo por técnico/hora [BRL] R$150,00</p><p>Duração 6 horas</p><p>Total por falha R$14.827,96</p><p>(Fonte: Elaborado pelo autor)</p><p>O segundo está relacionado à troca do acoplamento flexível por completo. Este cenário</p><p>também proporciona um custo relacionado ao equipamento que será reposto e às horas de</p><p>trabalho dos técnicos. Estes custos estão descritos na tabela abaixo.</p><p>21</p><p>Tabela 6 – Custos relacionados à troca do Acoplamento Flexível.</p><p>FLEXIBLE COUPLING,60HZ,640713 1 unidade</p><p>Custo por FLEXIBLE COUPLING, 60HZ,</p><p>640713 [BRL]</p><p>R$16.868,46</p><p>Técnicos necessários 3</p><p>Custo por técnico/hora [BRL] R$150,00</p><p>Duração 24 horas</p><p>Total por falha R$27.668,46</p><p>(Fonte: Elaborado pelo autor)</p><p>O terceiro cenário é o de principal relevância para o projeto, que se trata da troca reativa</p><p>de equipamentos. Neste caso, além do custo relacionado à compra de um novo acoplamento</p><p>flexível, outras peças do sistema também necessitam ser repostas. Estes valores podem ser</p><p>analisados a partir da tabela abaixo</p><p>Tabela 7 – Custos relacionados à falha tipo 3.</p><p>FLEXIBLE COUPLING, 60HZ, 640713 1 unidade</p><p>Custo por FLEXIBLE COUPLING, 60HZ, 640713 [BRL] R$16.868,46</p><p>TOP BOX, ELECTRICAL CABINET, 690V, ESS 1 unidade</p><p>Custo por TOP BOX, ELECTRICAL CABINET, 690V, ESS</p><p>[BRL]</p><p>R$140.273,58</p><p>SLIP RING UNIT 1 unidade</p><p>Custo por SLIP RING UNIT [BRL] R$17.399,43</p><p>SHROUD COUPLING, GENERATOR, RI=292MM 2 unidades</p><p>Custo por SHROUD COUPLING, GENERATOR,</p><p>RI=292MM [BRL]</p><p>R$477,64</p><p>PROXIMITY SENSOR ASSEMBLY, GENERATOR 1 unidade</p><p>Custo por PROXIMITY SENSOR ASSEMBLY,</p><p>GENERATOR [BRL]</p><p>R$1.180,53</p><p>CABLE ASSY, GEN TO BUSBAR,444 KCMIL, ESS 1 unidade</p><p>Custo por CABLE ASSY, GEN TO BUSBAR,444 KCMIL,</p><p>ESS [BRL]</p><p>R$2.997,51</p><p>LUG, CABLE, LONG BARREL, 444 KCMIL, 2HOLE, CU 4 unidades</p><p>22</p><p>Custo por LUG, CABLE, LONG BARREL, 444 KCMIL,</p><p>2HOLE, CU [BRL]</p><p>R$79,78</p><p>BUSBAR TO CABLE TRANSITION KIT 4 unidades</p><p>Custo por BUSBAR TO CABLE TRANSITION KIT [BRL] R$32,91</p><p>Nacelle REPARO</p><p>Custo por reparo da Nacelle R$35.000,00</p><p>Técnicos necessários 3</p><p>Custo por técnico/hora [BRL] R$150,00</p><p>Duração 32 horas</p><p>Total por falha R$229.525,55</p><p>(Fonte: Elaborado pelo autor)</p><p>Analisando as informações da tabela acima, pode-se perceber que o custo total de uma</p><p>troca reativa é de R$229.525,55. A partir do projeto, é possível prevenir este cenário e fazer</p><p>uma troca relativa aos flex packs ou ao acoplamento flexível, impedindo o rompimento total e</p><p>proporcionando uma economia de pelo menos R$201.857,09 por falha.</p><p>O projeto, como já citado anteriormente, visa detectar anomalias referentes a turbinas</p><p>que possuem o acoplamento flexível Arpex em sua estrutura. O universo de turbinas da GE é</p><p>divido em diferentes frotas, classificadas como 1X, 2X e 3X. Neste estudo, o foco será nas</p><p>turbinas da frota 1X, pois são as que possuem</p><p>uma nomenclatura é utilizada, onde as primeira letras</p><p>fazem referência ao nome do parque onde a turbina está localizada, e os algarismos ao número</p><p>da turbina. Pode-se ver um exemplo a seguir:</p><p>Suprimido a pedido da General Electric</p><p>A tabela abaixo da uma descrição mais detalhada dos dados das falhas disponíveis.</p><p>Suprimido a pedido da General Electric</p><p>28</p><p>Todos os arquivos de falha seguem um padrão em que, ao se aproximar da falha, a taxa</p><p>de amostragem aumenta. No início da coleta automática, o período de amostragem é de 1</p><p>minuto, em seguida se torna 10 segundos, depois 1 segundo e por fim, bem próximo a falha,</p><p>0,01 segundos.</p><p>Para análises de falha em máquinas rotativas, é de extrema importância a análise</p><p>espectral dos sinais. Segundo o teorema de Nyquist, para uma coleta de dados com taxa de</p><p>amostragem 𝑓 [𝐻𝑧], é possível construir a análise espectral desses mesmos dados até a</p><p>frequência</p><p>𝑓</p><p>2</p><p>[𝐻𝑧]. Portanto, o período de amostragem tem efeito direto na análise espectral.</p><p>Na coleta de dados descrita acima, o único período de amostragem que permite gerar uma</p><p>análise espectral com uma faixa de frequência considerável, é o de 0,01 segundos, o qual</p><p>representa uma taxa de amostragem de 100 Hz e pode gerar a análise espectral até 50 Hz. Os</p><p>outros períodos de amostragem não são utilizados pois não permitem uma faixa grande de</p><p>análise de frequências, sendo seus valores máximos sempre menor do que 1 Hz. Essa seleção é</p><p>feita por meio do código no Apêndice E, o qual faz essa separação automaticamente. Para o</p><p>código no Apêndice E funcionar corretamente, é necessário que ele esteja no mesmo local que</p><p>do que os arquivos da pasta “Defeituosa” no Anexo A.</p><p>Durante uma primeira análise dos dados, nota-se que em 7 das 10 falhas, com</p><p>informações sobre torque, a turbina operava com torque nominal de aproximadamente 12 Nm</p><p>no momento da falha. E em mais 2 casos com torque próximo de 11 Nm. Em vista disso, foi</p><p>adotado uma estratégia de captar dados de turbinas saudáveis quando operando com torque</p><p>maior do que 10,7 Nm, e assim fazer a comparação com as máquinas saudáveis e defeituosas</p><p>trabalhando no mesmo modo de operação. É determinado como turbina saudável, turbinas que</p><p>passaram por uma inspeção recentemente que não acusou defeitos.</p><p>Para ter um maior sucesso e precisão na análise, foram coletados dados de dois grupos</p><p>saudáveis diferentes. O primeiro é de turbinas com acoplamento Arpex do modelo antigo, o</p><p>mesmo em que as falhas acontecem, este grupo foi denominado de “Arpex”. E o segundo é</p><p>composto pelo mesmo grupo de turbinas que já tiveram uma falha e agora estão operando com</p><p>um acoplamento Arpex do modelo novo. Este grupo foi denominado de “Foco de estudo”.</p><p>Os arquivos coletados de máquinas saudáveis são chamados de “DDRs” (Dynamic Data</p><p>Recorder). Cada DDR tem aproximadamente 5 minutos de duração. Para aumentar a quantidade</p><p>de dados e padronizá-los, alguns filtros são aplicados. Primeiramente, os arquivos são divididos</p><p>em 5 arquivos menores de 1 minuto. Em seguida, cada um desses arquivos é testado para ver</p><p>se apresenta:</p><p>29</p><p>• um sinal de torque com média maior do que 10,7 Nm, e</p><p>• um desvio padrão menor do que 0,5 e uma média de aceleração em um dos eixos</p><p>diferente de zero, para checar se não houve falha na coleta de dados de aceleração.</p><p>Este processo é feito por meio dos códigos Apêndice C e Apêndice D. Para esses</p><p>códigos funcionarem de maneira correta, é necessário que eles estejam, respectivamente, no</p><p>mesmo local que os arquivos da pasta “Arpex” e “Foco_estudo” do Anexo A. A seguir é</p><p>possível ver um detalhamento maior da quantidade de arquivos obtidos no final.</p><p>Tabela 14 – Dados disponíveis após pré-processamento.</p><p>Grupo</p><p>Quantidade</p><p>de Turbinas</p><p>Quantidade</p><p>Arquivos</p><p>Arpex 6 147</p><p>Foco de Estudo 4 384</p><p>Defeituosas 5 6</p><p>(Fonte: Elaborado pelo autor)</p><p>Suprimido a pedido da General Electric</p><p>Ao comparar densidade espectral do sinal de aceleração dos grupos “Arpex”, “Foco de</p><p>estudo” e “Defeituosas”, é possível notar que o grupo “Foco de estudo” se destaca, com valores</p><p>de pico superiores as “Defeituosas”. Tal comparação pode ser vista no Apêndice I. Já o grupo</p><p>“Arpex” apresenta valores consideravelmente menores do que as “Defeituosas”. O grupo “Foco</p><p>de estudo” possui um novo modelo de acoplamento, apresentando uma rigidez diferente, o que</p><p>pode afetar seus valores de aceleração. Sabendo disso e comparando os valores de aceleração</p><p>dos três grupos, decidiu-se que os dados a serem analisados futuramente seriam apenas dos</p><p>grupos “Arpex” e “Defeituosas”, sendo “Arpex” consideradas como saudáveis.</p><p>Ao comparar os dados da falha da turbina WTG-01* com todas outras turbinas, tanto</p><p>com falha quanto saudáveis, percebe-se que ela apresenta valores de amplitude aceleração no</p><p>domínio da frequência muito superiores a todas outras, na ordem de 10 vezes maior. Também</p><p>é possível observar que esses valores altos de aceleração continuaram se repetindo após a troca</p><p>do acoplamento. Dessa forma, foi considerado que esses valores de aceleração altos podem</p><p>estar sendo gerados por outra parte do sistema, e com isso, os dados dessa turbina foram</p><p>desconsiderados para não afetar o resultado do projeto.</p><p>*suprimido a pedido da General Electric</p><p>30</p><p>Todos arquivos de máquinas do grupo “Defeituosas”, “Arpex” e “Foco de estudo” antes</p><p>do pré-processamento estão disponíveis no Anexo A. Estão também disponíveis os dados pós</p><p>processados e divididos em grupos de teste e treino do grupo “Arpex”, o qual foi utilizado na</p><p>análise, no Anexo B. Os arquivos pós processados do grupo “Defeituosas” está disponível no</p><p>Anexo C Dados de um quarto grupo chamado “KTR”, sem nenhum processamento, estão</p><p>disponíveis no Anexo D, entretanto não foram levados em consideração na análise pois são</p><p>turbinas que possuem um acoplamento diferente.</p><p>31</p><p>6. Metodologia e Resultados</p><p>Para fazer a detecção de anomalia do acoplamento flexível nas turbinas eólicas da GE,</p><p>o processo foi dividido em quatro seções: Pré-processamento de dados, separação de dados</p><p>entre teste e treino, análise e seleção dos indicadores de condição e treinamento dos</p><p>classificadores e uma parte específica para teste e algoritmo desenvolvido para o usuário. É</p><p>possível ver na Figura 11 mais detalhes de cada seção. Todos os métodos utilizados e códigos</p><p>desenvolvidos utilizaram o software MATLAB_R2020b.</p><p>A parte de Pré-processamento de dados foi abordada na seção “Dados”, onde é</p><p>explicado como os arquivos são subdivididos e filtrados. Com os dados selecionados, é</p><p>necessário dividi-los em 2 grupos, os de Treino e os de Teste. Isso é feito para possibilitar uma</p><p>validação do modelo treinado. Essa divisão é feita por meio do código no Apêndice F, que</p><p>separa de forma aleatória 75% dos arquivos para treino e 25% para teste. Para que o código no</p><p>Apêndice F funcione de maneira correta, é necessário que ele esteja no mesmo local do que os</p><p>arquivos do Anexo B.</p><p>O projeto tem como objetivo entregar dois principais códigos de programação. Um para</p><p>análise dos sinais, seleção dos indicadores de condição e treinamento dos modelos de machine</p><p>learning, e outro específico para testes, validação e para o usuário, no caso a GE. O script de</p><p>análise e treinamento (Apêndice G) foi desenvolvido para fazer a análise espectral de aceleração</p><p>e então escolher os indicadores de condição. Com tais indicadores selecionados, é realizado o</p><p>treinamento da PCA e do classificador, mais detalhes sobre esses modelos são dados</p><p>posteriormente.</p><p>Geralmente, treinamentos de modelos são feitos com uma porção dos dados disponíveis</p><p>para que o modelo que está sendo utilizado, como por exemplo um classificador, possa extrair</p><p>informações de como estes dados geralmente se comportam e guardar essas informações para</p><p>classificar dados em análises futuras. Tais informações podem ser também chamadas de</p><p>parâmetros. Nesse script, tais parâmetros</p><p>são salvos em um arquivo (Apêndice J) para que</p><p>sejam utilizados posteriormente ao analisar dados no outro script.</p><p>O script de análise e treinamento não foi criado para ser editado em um primeiro</p><p>momento, pois análises já foram feitas e os indicadores de condição já foram selecionados.</p><p>Porém, é possível modificá-lo se o usuário desejar refazer as análises, mudar os arquivos a</p><p>analisar, ou mesmo melhorar a análise. O segundo código é o do usuário e teste (Apêndice H).</p><p>Este código utiliza os parâmetros resultantes do treinamento, e então processa e analisa as</p><p>máquinas que se deseja saber a condição. A seguir será apresentado mais detalhadamente cada</p><p>seção dos dois códigos citados anteriormente, acompanhados de seus respectivos resultados.</p><p>Figura 12 – Fluxograma geral da metodologia.</p><p>(Fonte: Elaborado pelo autor)</p><p>6.1. “Treinamento_e_Análise.mlx”</p><p>Esta etapa tem a função de analisar os sinais dos sensores no domínio frequência, e</p><p>assim decidir quais serão selecionados para compor futuramente os indicadores de condição.</p><p>Os parâmetros extraídos dos treinamentos dos modelos também são adquiridos nessa seção e</p><p>então utilizados no código do usuário, para que o código do usuário seja bem mais veloz e tenha</p><p>um processamento muito menor de arquivos, diminuindo os esforços computacionais. O código</p><p>que faz isso é o “Treinamento_e_Análise.mlx” (Apêndice G). Para o código no Apêndice G</p><p>funcionar de maneira correta, é necessário que ele esteja no mesmo local do que os arquivos da</p><p>pasta “Treino” do Anexo B. Abaixo é possível ver um fluxograma que descreve mais</p><p>detalhadamente esse código.</p><p>Figura 13 – Fluxograma código “Treinamento_e_Analise.mlx”.</p><p>(Fonte: Elaborado pelo autor)</p><p>6.1.1. Leitura de arquivos</p><p>A primeira seção do código é apenas uma conexão entre os arquivos e o resto do código.</p><p>Ela lê os arquivos onde estão os dados de treino e os defeituosos e os salva com uma formatação</p><p>diferente, no estilo tabela. Esta tabela será utilizada nas outras seções para análises.</p><p>34</p><p>Tabela 16 – Tabela dos dados que serão analisados.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>Sendo:</p><p>• TTime_init o momento inicial da coleta,</p><p>• TTime o vetor tempo, com momento de cada valor</p><p>• VAR_ o vetor com todas as variáveis que se tem disponibilidade para análise,</p><p>• estado a condição da máquina, sendo 1 para saudáveis e -1 para defeituosas,</p><p>• Máquina o nome de cada turbina e</p><p>• Grupo o grupo a qual ela pertence</p><p>6.1.2. Definição dos indicadores de condição</p><p>Esta seção está destinada a selecionar as máquinas que se deseja analisar, assim como</p><p>os sinais e indicadores de condição. Como já dito, este projeto tem o intuito de detectar</p><p>anomalias em acoplamentos flexíveis de turbinas eólicas. Para a escolha dos sinais que seriam</p><p>analisados, diversos estudos e rigorosas análises foram feitas. Primeiramente analisou-se sinais</p><p>de torque e momentos da torre. Entretanto não foram encontrados bons indicadores para</p><p>determinar a falha. Em seguida foi analisado sinais de correte do gerador e diversos</p><p>acelerômetros da torre. Apesar dos sinais de corrente do gerador conseguirem uma melhor</p><p>separação das máquinas defeituosas e saudáveis, essa diferença estava atenuada em relação ao</p><p>obtido nos sinais de aceleração, o que já era esperado segundo os estudos prévios estudados.</p><p>35</p><p>Portanto, decidiu-se por fazer a análise puramente por sensores de aceleração. Como já</p><p>dito diversos sensores de aceleração foram analisados. Entretanto, foram escolhidos para uma</p><p>melhor análise apenas os mais bem posicionados para detecção da vibração do acoplamento</p><p>flexível. Após análise aprofundada, três sensores foram selecionados. Tais sensores estão</p><p>localizados em uma placa situada na base da Nacelle, na conexão da mesma com a torre. Seus</p><p>dados são coletados pelo software SCADA, onde são referidos por “DtaAccelerationX”,</p><p>“DtaAccelerationY” e “DtaAccelerationZ”. Sua orientação segue o sistema de coordenadas na</p><p>Figura 13.</p><p>Figura 14 – Sistema coordenadas para orientação.</p><p>(Fonte:https://www.ge.com/renewableenergy/sites/default/files/2020-01/GE-Poster-</p><p>Landscape-Onshore-Wind-3.2-103-3000px.jpg)</p><p>Os dados coletados destes sensores são séries temporais. A Figura 14 mostra um</p><p>exemplo de série temporal de um sensor de aceleração da turbina. Para uma melhor análise e</p><p>detecção de anomalias e reduzir complexidade computacionais, converte-se as séries temporais</p><p>para o domínio da frequência por meio da Transformada Rápida de Fourier (FFT). O domínio</p><p>da frequência possibilita observar um sinal complexo de maneira mais simples, separando suas</p><p>componentes por suas frequências e amplitudes, um exemplo de FFT de um sensor de</p><p>aceleração é ilustrado na Figura 15. Além disso, a fórmula que rege a decomposição contínua</p><p>de um sinal por FFT está descrita a seguir. Vale ressaltar que o MATLAB usa uma versão</p><p>discreta da Transformada de Fourier.</p><p>Z</p><p>Y</p><p>X</p><p>36</p><p>𝐹(𝑡) = 𝑎0 + ∑[𝑎𝑛 cos(𝑛𝜔0𝑡) + 𝑏𝑛sin (𝑛𝜔0𝑡)]</p><p>∞</p><p>𝑛=1</p><p>Dentro da qual 𝑎0 é a componente CC e 𝑎𝑛 𝑒 𝑏𝑛 são as componentes CA. 𝑎0,𝑎𝑛 𝑒 𝑏𝑛</p><p>são dadas respectivamente por:</p><p>𝑎0 =</p><p>1</p><p>2𝜋</p><p>∫ 𝑓(𝜔𝑡)𝑑𝜔𝑡</p><p>𝜋</p><p>−𝜋</p><p>𝑎𝑛 =</p><p>1</p><p>𝜋</p><p>∫ 𝑓(𝜔𝑡) cos(𝑛𝜔0𝑡) 𝑑𝜔𝑡</p><p>𝜋</p><p>−𝜋</p><p>𝑏𝑛 =</p><p>1</p><p>𝜋</p><p>∫ 𝑓(𝜔𝑡) sin(𝑛𝜔0𝑡) 𝑑𝜔𝑡</p><p>𝜋</p><p>−𝜋</p><p>Figura 15 – Gráfico série temporal de um sensor de aceleração de uma turbina.</p><p>(Fonte: Gerado pelo autor no software Matlab)</p><p>37</p><p>Figura 16 – Gráfico espectral de um sensor de aceleração de uma turbina.</p><p>(Fonte: Gerado pelo autor no software Matlab)</p><p>Com os dados já transformados para o domínio da frequência, é necessário decidir as</p><p>frequências que serão analisadas, para então captar os valores de pico desejados e colocá-los</p><p>em uma tabela.</p><p>Para a escolha das frequências que seriam analisadas, primeiramente decidiu-se</p><p>selecionar frequências mais altas para que não houvesse influência das frequências de</p><p>ressonância da Torre ou da Naccele, as quais são baixas.</p><p>As turbinas da GE em geral têm velocidade de rotação nominal no lado do gerador</p><p>próxima a 1500 rpm, dependendo do seu modelo podem ter rotações nominais um pouco</p><p>diferente. A partir disso, é possível calcular a frequência fundamental de rotação, chegando no</p><p>valor de 25Hz. É interessante analisar este valor pois ele pode trazer informações sobre</p><p>possíveis defeitos por meio da rotação do acoplamento flexível. Dessa forma, a região perto de</p><p>25Hz na análise espectral nos três sinais serão coletados. Como a frequência em que o pico</p><p>aparece é diretamente afetada pela rotação da máquina, como já descrito acima, uma</p><p>normalização da frequência foi feita para alinhar os picos das máquinas que estavam operando</p><p>em uma velocidade diferente. Uma pequena faixa de frequência é analisada ao invés de apenas</p><p>uma frequência específica, para compensar eventuais desalinhamentos remanescentes.</p><p>38</p><p>Para a seleção de mais indicadores de condição, análises rigorosas foram feitas.</p><p>Diversas frequências foram observadas e comparadas para seleção dos melhor indicadores.</p><p>Essa análise foi composta por uma comparação entre os valores dos picos de dados saudáveis</p><p>e dados defeituosos. As frequência com melhor distinção em cada um dos sinais, foram</p><p>selecionadas. Tais indicadores podem ser encontradas na Tabela 15. Essas frequências</p><p>selecionadas são as sidebands geradas pela frequência fundamental ou pelo segundo harmônico</p><p>(50Hz) das turbinas. Simplificadamente, as sidebands são sinais gerados por sinais mais fortes,</p><p>como a frequência fundamental ou pelo segundo harmônico (50Hz) das turbinas.</p><p>Tabela 17 – Sinais e frequências a serem analisados.</p><p>Sinal</p><p>Faixa de frequência</p><p>Frequência inicial</p><p>[Hz]</p><p>Frequência final</p><p>[Hz]</p><p>DtaAccelerationY 22 27</p><p>DtaAccelerationY 36 40</p><p>DtaAccelerationX 26 29</p><p>DtaAccelerationX 40 46</p><p>DtaAccelerationZ 23 25,5</p><p>DtaAccelerationZ 33 34,5</p><p>(Fonte: Elaborado pelo autor)</p><p>Decidido os</p><p>sinais e frequências que serão analisados, é feita a coleta dos valores do</p><p>picos nessas faixas, e então esses valores são tabelados, para dar sequência a análise nas</p><p>próximas etapas.</p><p>A seguir é possível ver duas figuras que comparam os dados saudáveis aos defeituosos.</p><p>A primeira mostra a análise espectral (sinal no domínio da frequência) de todos sinais e</p><p>frequências selecionados. A segunda mostra esses mesmos sinais, mas apenas os valores dos</p><p>picos já extraídos dessas faixas de frequência.</p><p>39</p><p>Figura 17 – Gráfico espectral, comparando turbinas saudáveis e defeituosas.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>Figura 18 – Gráfico valores dos picos, comparando turbinas saudáveis e defeituosas.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>22 --> 27 [Hz]</p><p>0</p><p>1</p><p>2</p><p>3</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationY</p><p>36 --> 40 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-9 DtaAccelerationY</p><p>26 --> 29 [Hz]</p><p>0</p><p>0.5</p><p>1</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationX</p><p>40 --> 46 [Hz]</p><p>0</p><p>1</p><p>2</p><p>3</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationX</p><p>23 --> 25.5 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationZ</p><p>33 --> 34.5 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-9 DtaAccelerationZ</p><p>Defeituosas</p><p>Saudáveis</p><p>Picos Análise Espectral Aceleração</p><p>40</p><p>6.1.3. Construção PCA</p><p>Na próxima etapa, o algoritmo capta os picos de interesse obtidos na etapa anterior e os</p><p>utiliza para treinamento de uma PCA (Principal Component Analysis). PCA (Principal</p><p>Component Analysis), de acordo com [18] é um algoritmo de redução de dimensionalidade de</p><p>dados, que utiliza uma série de dados de uma dada dimensão e os projeta em um hiperplano de</p><p>dimensionalidade menor que possui a maior variância dos dados. A decomposição de uma</p><p>matriz de dados X em suas componentes principais pode ser dada por:</p><p>𝑋 = 𝑈 ∙ 𝑆 ∙ 𝑉𝑇</p><p>Nesta fórmula, X é a matriz de dados original. U, S e V são matrizes de números reais.</p><p>Destas, a matriz U não será utilizada na PCA, a matriz S dará a ordem das componentes</p><p>principais e a matriz V é a matriz de coeficientes da PCA, que será discutida. Uma vez</p><p>adquiridos os coeficientes, a PCA pode ser aplicada ao conjunto de dados original por:</p><p>𝑇 = 𝑋 ∙ 𝑉</p><p>Onde T é a nova matriz de dados, de dimensionalidade menor que X.</p><p>Simplificadamente, a PCA recebe dados de uma determinada dimensão e os compacta</p><p>em uma dimensão menor, de forma a minimizar a perda de informação neste processo. No</p><p>contexto do algoritmo de detecção de anomalia, a PCA será aplicada para transformar as</p><p>variáveis de aceleração individuais em variáveis combinadas, que serão utilizadas como</p><p>indicadores de condição das turbinas. Para isso, inicialmente, é necessário treinar a PCA com</p><p>dados mistos, ou seja, tanto saudáveis quanto defeituosos, de modo que a mesma possa captar</p><p>a variância total dos dados. O resultado desse treinamento serão coeficientes que posteriormente</p><p>serão aplicados em dados novos.</p><p>O treinamento das PCA’s é realizado da seguinte forma: a função recebe os picos e</p><p>normaliza os valores pela média e desvio padrão, de modo que todos fiquem na mesma</p><p>grandeza de medida. A equação da normalização é dada por:</p><p>𝑉𝑎𝑙𝑜𝑟 𝑛𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑎𝑑𝑜 =</p><p>𝑉𝑎𝑙𝑜𝑟 𝑛ã𝑜 𝑛𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑎𝑑𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜</p><p>𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜</p><p>41</p><p>Onde Valor máximo e Valor mínimo correspondem aos extremos do range de valores</p><p>do score, sendo o Valor máximo o valor do indicador para a mais saudável turbina e Valor</p><p>mínimo para a mais defeituosa.</p><p>Em seguida, os valores normalizados passam pela função “pca( )” do</p><p>MATLAB_R2020b e os coeficientes da PCA são obtidos, tal qual mostrados na figura abaixo.</p><p>Figura 19 – Tabela de coeficientes da PCA.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>6.1.4. Implementação PCA</p><p>Obtidos os coeficientes do treinamento das PCAs, a função “Aplicar_PCA( )” os recebe,</p><p>juntamente com os picos dos dados nos quais se deseja realizar a análise. Os dados de entrada</p><p>são então normalizados pela média e desvio padrão e então multiplicados pelos coeficientes</p><p>obtidos na etapa anterior, gerando assim os indicadores de condição que serão utilizados para</p><p>treinamento e predição do classificador. Para evitar a perda significativa de informação neste</p><p>processo, foram utilizadas as três PCAs que mais justificam a variância dos dados.</p><p>Conjuntamente, as três explicam cerca de 85% da variância. Não foram escolhidas quatro PCAs</p><p>(as quais explicariam 95% da variância), pois a diferença na acurácia final foi de menos de 1%.</p><p>A diferença entre os indicadores de condição saudáveis e defeituosos irá influenciar o</p><p>sucesso do classificador em detectar a anomalia, que será abordado em detalhes adiante. A</p><p>figura abaixo indica graficamente o resultado das três primeiras PCAs de turbinas saudáveis e</p><p>defeituosas. É perceptível e clara a diferença entre os indicadores de condição nos dois casos.</p><p>42</p><p>Figura 20 – Gráfico 3D indicadores de condição (IC), comparando turbinas</p><p>saudáveis e defeituosas.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>Figura 21 – Gráfico 3D indicadores de condição (IC), comparando turbinas</p><p>saudáveis e defeituosas (Outra orientação)</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>43</p><p>6.1.5. Construção Classificador</p><p>Uma vez determinados os indicadores de condições, é possível treinar o classificador.</p><p>O modelo utilizado foi o Classificador de Classe Única por SVM (One-Class SVM Classifier),</p><p>um método não supervisionado. Uma SVM (Support Vector Machine), de acordo com [18]</p><p>consiste em um algoritmo de aprendizagem utilizado para classificações, regressões e detecção</p><p>de outliers (como neste caso), que se destaca por ser utilizado tanto para problemas lineares</p><p>quanto não lineares. A ideia básica de um SVC (Support Vector Classifier) consiste em criar a</p><p>maior fronteira possível entre as diferentes classes, de modo a minimizar o erro ao prever novas</p><p>instâncias.</p><p>No caso do One-Class Classifier, o algoritmo é treinado apenas com uma classe de</p><p>dados, no caso, a classe saudável. No fluxograma da Figura 12 é observável que os indicadores</p><p>saudáveis são a única entrada da função de treinamento. Com isso, a SVM delimitará os limites</p><p>dentro dos quais os indicadores de condição serão considerados saudáveis. Além disso, o</p><p>classificador irá gerar um score, baseado na distância em que o ponto analisado se encontra em</p><p>relação à zona saudável. Esse score é então normalizado entre 1 e 0, sendo que quanto mais</p><p>próximo de zero, menor a distância até a zona saudável e, portanto, mais saudável a turbina. A</p><p>Figura 21 mostra a representação dos limites obtidos pelo classificador em seu treinamento.</p><p>Pode-se notar uma zona azulada, onde os indicadores da turbina deverão estar quando</p><p>saudáveis. O gradiente de cores indica a constante degradação da turbina, até chegar na zona</p><p>em vermelho, onde há altíssimo risco de falha. É importante ressaltar que o classificador foi</p><p>treinado com expectativa de outliers de 5%.</p><p>44</p><p>Figura 22 – Gradiente de cores do score do classificador.</p><p>(Fonte: Gerado pelo código no Apêndice G)</p><p>45</p><p>6.2. “Usuário_e_Teste.mlx”</p><p>Como já descrito, esta etapa tem a função de detectar a anomalia em uma turbina que o</p><p>usuário, ou seja, os engenheiros da GE, desejam analisar. Para isso, basta inserir os dados da</p><p>turbina que se deseja analisar e, a partir dos parâmetros de treinamento (Apêndice J)</p><p>determinados na seção anterior, o resultado é gerado, determinado quão anômalo está o</p><p>acoplamento desta turbina. O código “Usuario_e_Teste.mlx” (Apêndice H), gerado nessa</p><p>seção, será utilizado diretamente pelo usuário ou para se fazer testes e determinar a acurácia do</p><p>modelo. Para o código no Apêndice H funcionar de maneira correta, é necessário que ele esteja</p><p>no mesmo</p><p>local do que os arquivos da pasta “Teste” do Anexo B e que o Apêndice J. A seguir</p><p>é possível ver um fluxograma com mais detalhes.</p><p>Figura 23 – Fluxograma código “Usuario_e_Teste.mlx”.</p><p>(Fonte: Elaborado pelo autor)</p><p>46</p><p>6.2.1. Leitura arquivos</p><p>Assim como no outro código, a primeira seção é apenas uma conexão entre os arquivos</p><p>e o resto do código. Ela lê os arquivos onde estão os dados de teste ou os dados que se deseja</p><p>obter uma análise e os salva com uma formatação diferente, no estilo tabela. Esta tabela será</p><p>utilizada nas outras seções para detecção da anomalia.</p><p>6.2.2. Extração indicadores de condição</p><p>Com os dados já tabelados, os indicadores de condição são extraídos do sinal que se</p><p>deseja analisar. Não é necessário acrescentar nenhuma informação sobre tais indicadores, pois</p><p>os parâmetros já foram salvos no código de treino e análise. Com as informações dos</p><p>indicadores de condição, os valores dos picos nesses sinais e frequências são captados e então</p><p>tabelados.</p><p>Esta seção tem como resultado um gráfico para cada indicador de condição, onde os</p><p>valores dos picos das máquinas saudáveis, defeituosas e as que se está analisando são</p><p>comparados.</p><p>Figura 24 – Gráfico valores dos picos, comparando turbinas</p><p>saudáveis, defeituosas e em análise.</p><p>(Fonte: Gerado pelo código no Apêndice H)</p><p>22 --> 27 [Hz]</p><p>0</p><p>1</p><p>2</p><p>3</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationY</p><p>36 --> 40 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-9 DtaAccelerationY</p><p>26 --> 29 [Hz]</p><p>0</p><p>0.5</p><p>1</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationX</p><p>40 --> 46 [Hz]</p><p>0</p><p>1</p><p>2</p><p>3</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationX</p><p>23 --> 25.5 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-8 DtaAccelerationZ</p><p>33 --> 34.5 [Hz]</p><p>0</p><p>2</p><p>4</p><p>A</p><p>c</p><p>e</p><p>le</p><p>ra</p><p>ç</p><p>ã</p><p>o</p><p>[</p><p>m</p><p>/s</p><p>2</p><p>] 10</p><p>-9 DtaAccelerationZ</p><p>Análise</p><p>Saudáveis</p><p>Defeituosas</p><p>Picos Análise Espectral Aceleração</p><p>47</p><p>6.2.3. Implementação PCA</p><p>Assim como na seção anterior, os coeficientes para gerar as PCAs já foram calculados</p><p>no outro código, e assim basta aplicar esses coeficientes nos dados que estão sendo analisados.</p><p>O número de PCAs selecionadas como indicador de condição segue o escolhido na análise e</p><p>treinamento. Como já dito, foram escolhidas as três primeiras componentes da PCA.</p><p>Após obtido os valores das PCAs, um gráfico 3D é gerado com as três primeiras PCAs,</p><p>e então uma comparação dos dados saudáveis, defeituosos e em análise é feita. É possível ver</p><p>este gráfico a seguir.</p><p>Figura 25 – Gráfico 3D indicadores de condição (IC), comparando turbinas</p><p>saudáveis, defeituosas e em análise.</p><p>(Fonte: Gerado pelo código no Apêndice H)</p><p>48</p><p>Figura 26 – Gráfico 3D indicadores de condição (IC), comparando turbinas</p><p>saudáveis, defeituosas e em análise (Outra orientação).</p><p>(Fonte: Gerado pelo código no Apêndice H)</p><p>6.2.4. Previsão Classificador</p><p>Como dito anteriormente, o classificador tem como saída o label, ou seja, a classificação</p><p>da turbina analisada entre saudável e defeituosa e também um score, que fornece a informação</p><p>sobre o quão defeituosa está essa turbina. Para devolver ao usuário um modo gráfico de</p><p>visualização desta informação, o algoritmo gera uma colorbar indicativa, na qual estão</p><p>presentes os indicadores limites (0 para o mais saudável possível e 1 para o mais defeituoso</p><p>possível) e também um threshold, determinado para delimitar o que o classificador considera</p><p>saudável e o que é considerado defeituoso.</p><p>Para validação, foram utilizados tanto dados saudáveis quanto defeituosos. A acurácia</p><p>medida no classificador foi de 100% quando utilizando dados defeituosos e 97,30% com dados</p><p>saudáveis. A seguir é possível observar um exemplo do resultado de uma análise de dados de</p><p>uma máquina defeituosa.</p><p>49</p><p>Figura 27 – Label mostrando quantificação da anomalia na turbina</p><p>analisada.</p><p>(Fonte: Gerado pelo código no Apêndice H)</p><p>50</p><p>7. Conclusões e trabalhos futuros</p><p>Este trabalho mostrou que é possível detectar anomalias na operação de acoplamentos</p><p>flexíveis de turbinas eólicas através de medições de aceleração e modelos de Machine Learning</p><p>de classificação não-supervisionada.</p><p>O projeto previa o levantamento e organização dos dados de indicadores das turbinas,</p><p>fornecidos pela própria empresa parceira e o desenvolvimento de um algoritmo que pudesse</p><p>otimizar a operação de gerenciamento e manutenção das turbinas da GE. Com um baixo custo</p><p>de desenvolvimento e um resultado de acordo com o previsto pela equipe, o projeto demonstrou</p><p>um grande potencial financeiro, podendo gerar uma economia relevante em 10 anos apenas em</p><p>turbinas da frota 1X, o que viabiliza a sua implantação e abre a possibilidade do</p><p>desenvolvimento para outras frotas de turbinas.</p><p>Durante a análise dos dados de falhas disponíveis, nota-se que 9 das 10 turbinas</p><p>falharam com torque próximo ao seu torque nominal. Em vista disso, concluiu-se que a</p><p>campanha de medição de dados das turbinas eólicas deveria captar dados das turbinas atuando</p><p>próximo ao torque nominal, para que as máquinas saudáveis e defeituosas estivem no mesmo</p><p>modo de operação ao compará-las.</p><p>Após rígida análise das variáveis selecionada para coleta, foi possível achar sinais e</p><p>frequências em que todas, ou a maioria, dos dados defeituosos se destacavam dos dados</p><p>saudáveis. Tais sinais foram selecionados como indicadores de condição e apresentaram um</p><p>bom resultado no final do projeto.</p><p>Ao realizar a fusão dos indicadores de condição por meio da PCA, concluiu-se que as</p><p>três primeiras componentes da PCA seriam selecionadas, pois, selecionando mais</p><p>componentes, o resultado final não tinha uma melhora expressiva. A seleção de apenas três</p><p>componentes também facilita a visualização dos dados, por poder construir um gráfico em três</p><p>dimensões. Com este gráfico foi possível concluir que havia uma separação entre o grupo de</p><p>dados saudáveis e defeituosos e que dessa forma, era possível distinguir turbinas saudáveis de</p><p>turbinas defeituosas.</p><p>Analisando os dados disponíveis, concluiu-se que não seria possível desenvolver um</p><p>algoritmo que calcula a RUL, pois para isso é necessário ter dados de toda degradação da</p><p>turbina. No caso, estão apenas disponíveis dados da turbina saudável e da turbina com falha.</p><p>Tendo isso em vista, decidiu-se utilizar um classificador não-supervisionado para detecção de</p><p>anomalias. Como o número de dados de turbinas saudáveis é muito maior do que o número de</p><p>dados no momento da falha, decidiu-se fazer um classificador de única classe utilizando esses</p><p>dados saudáveis para se obter uma maior precisão.</p><p>51</p><p>Como exposto na seção de resultados, a acurácia do algoritmo para detecção e</p><p>quantificação de anomalia em turbinas eólica apresentou um bom desempenho, classificando</p><p>97,30% das vezes de maneira correta o estado das turbinas, podendo trazer um grande benefício</p><p>para a empresa (GE), como já apresentado no business case. Entretanto, este valor</p><p>provavelmente não é sua real acurácia. Como apenas 4 arquivos de falhas estavam disponíveis</p><p>e dentro dos padrões estipulados para análise no momento do trabalho, e 6 máquinas saudáveis</p><p>foram levadas em consideração, o valor calculado de acurácia pode estar sendo afetado pela</p><p>confiabilidade e amostra dos dados.</p><p>Para sanar esta dúvida, propõe-se que futuramente sejam implementados dados de mais</p><p>máquinas saudáveis1, assim como dados de máquinas momentos antes da falha. Dessa forma,</p><p>o valor calculado para acurácia do algoritmo será mais preciso e poderá guiar a empresa melhor</p><p>nas suas decisões.</p><p>Como trabalho futuro, propõe-se a análise de outros sensores e sinais ainda não</p><p>explorados, e se obtiverem bom resultado, a adição dos mesmos nos indicadores de condição.</p><p>Outro trabalho futuro proposto é a obtenção de dados ao longo da vida útil da máquina, e não</p><p>apenas dados saudáveis ou defeituosos, para que a degradação seja modelada e a RUL possa</p>ser calculada. 
Por último, uma adição interessante ao projeto, seria o estudo dos resultados para 
diagnóstico, ou seja, conseguir determinar a causa da falha. Tal adição poderia ser realizado 
por uma clusterização acompanhado de uma análise física dos resultados. Tais trabalhos futuros 
podem ser abordados na disciplina optativa de PFE Avançado lecionada no Insper, por outros 
grupos que queiram dar continuidade ao projeto ou mesmo pela própria empresa (GE), para 
refinar e melhorar o produto final. 
Alguns passos são sugeridos antes da implementação deste projeto no dia a dia da 
empresa. Primeiramente a coleta de mais dados saudáveis e defeituosos para calcular de 
maneira mais precisa o valor da acurácia e assim possibilitar a empresa traçar sua estratégia. 
Em seguida, testes do algoritmo com máquinas que apresentem alguma falha, mas que ainda 
estejam funcionando, para fazer um paralelo com o sucesso do algoritmo. Por último, a 
implementação de uma captação de dados com regularidade, para que possa ser feita a 
integração do algoritmo com o sistema SCADA e então funcionar de maneira mais autônoma. 
 
 
1 São consideradas máquinas saudáveis, turbinas que tenham passado por uma inspeção 
recente e nenhuma anomalia foi detectada. 
52 
Referências 
[1] https://www.ge.com/ 
[2] https://www.ge.com/renewableenergy/ 
[3] Qiao, W.; Qu, L. Prognostic Condition Monitoring for Wind Turbine Drivetrains via 
Generator Current Analysis, 2018, NE 68588-0511. 
[4] Breteler, D.; Kaidis, C.; Tinga, T.; Loendersloot, R. Physics based methodology for wind 
turbine failure detection, diagnostics & prognostics, 2015. 
[5] Asgarpour, M.; Sørensen, J. D. Bayesian based Prognostic Model for Predictive 
Maintenance of Offshore Wind Farms, 2018. 
[6] Li, N.; Lei, Y.; Lin, J.; Ding, S.X. An Improved Exponential Model for Predicting 
Remaining Useful Life of Rolling Element Bearings. IEEE Trans. Ind. Electron. 2015, 62, 
7762–7773. 
[7] Wu, J.; Wu, C.; Cao, S.; Or, S.W.; Deng, C.; Shao, X. Degradation Data-Driven Time-To-
Failure Prognostics Approach for Rolling Element Bearings in Electrical Machines. IEEE 
Trans. Ind. Electron. 2018, 66, 529–539 
[8] Loukopoulos, P.; Zolkiewski, G.; Bennett, I.; Sampath, S.; Pilidis, P.; Li, X.; Mba, D. 
Abrupt fault remaining useful life estimation using measurements from a reciprocating 
compressor valve failure. Mech. Syst. Signal Process. 2019, 121, 359–372. 
[9] Zhang, S.; Ganesan, R.; Xistris, G. Self-organising neural networks for automated 
machinery monitoring systems. Mech. Syst. Signal Process. 1996, 10, 517–532. 
[10] Escaler, X.; Mebarki, T.Full-Scale Wind Turbine Vibration Signature Analysis, 2018. 
[11] MathWorks, Inc. Wind Turbine High-Speed Bearing Prognosis, 2018. 
[12] MathWorks, Inc.Update RUL Prediction as Data Arrives, 2018. 
[13] MathWorks, Inc. exponentialDegradationModel, 2020. 
[14] Elasha, F.; Suliman S.; Xiaochun L.; Mba D. Prognosis of a Wind Turbine Gearbox 
Bearing Using Supervised Machine Learning, 2019. 
53 
[15] R. Perdisci, G. Gu and W. Lee, "Using an Ensemble of One-Class SVM Classifiers to 
Harden Payload-based Anomaly Detection Systems," Sixth International Conference on Data 
Mining (ICDM'06), Hong Kong, 2006, pp. 488-498. 
[16] Shyu, M.; Chen, S.; Sarinnapakorn, K.; Chang, L. A Novel Anomaly Detection Scheme 
Based on Principal Component Classifier, 2006. 
[17] Erfani, S.; Rajasegarar, S.; Karunasekera, S.; Leckie, C. High-dimensional and large-scale 
anomaly detection using a linear one-class SVM with deep learning, 2016. 
[18] Géron, A. (2017). Hands-on Machine Learning with Scikit Learn & TensorFlow: concepts, 
tools, and techniques to build intelligent systems. O’Reilly. 
 
54 
A pasta “PFE” referida no Apêndice e no Anexo pode ser encontrada no link a seguir ou no 
“Box” disponibilizado pela GE. 
https://alinsperedu-
my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT
_tDKdA7QV35WuQs8IQ 
 
Apêndice 
Apêndice A – https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p 
Apêndice B – https://plan.toggl.com/#pg/tBg4SadI-DL7R7vVeZpJDhQbMDFDlSK8 
Apêndice C – PFE/Apendices/Pre_Processamento_Arquivos_Arpex.mlx 
Apêndice D – PFE/Apendices/Pre_Processamento_Arquivos_Foco.mlx 
Apêndice E – PFE/Apendices/Pre_Processamento_Arquivos_Defeituosos.mlx 
Apêndice F – PFE/Apendices/Sep_Teste_Treino.mlx 
Apêndice G – PFE/Apendices/Treinamento_e_analise.mlx 
Apêndice H – PFE/Apendices/Usuario_e_Teste.mlx 
Apêndice I – PFE/Apendices/Graficos 
Apêndice J – PFE/Apendices/ PCAs_E_PKS_saud.mat 
 
Anexo 
Anexo A – PFE/Anexos/Antes_Pre_Processamento 
Anexo B – PFE/Anexos /Pos_Processado/Arpex 
Anexo C – PFE/Anexos /Pos_Processado/Defeituosas 
Anexo D – PFE/Anexos/Antes_Pre_Processamento/KTR 
https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ
https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ
https://alinsperedu-my.sharepoint.com/:f:/g/personal/gabrieluas_al_insper_edu_br/Eq24ws9AZ9JEtkhyrRWRohIBWrgT_tDKdA7QV35WuQs8IQ
https://plan.toggl.com/#pp/1ehZNue4dvF4zmb2PFk71aucjhAn6Z0p
https://plan.toggl.com/#pg/tBg4SadI-DL7R7vVeZpJDhQbMDFDlSK8