Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/46345
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | BARBOSA, Luciano de Andrade | - |
dc.contributor.author | CRUZ, Michael Oliveira da | - |
dc.date.accessioned | 2022-09-12T16:43:45Z | - |
dc.date.available | 2022-09-12T16:43:45Z | - |
dc.date.issued | 2022-07-01 | - |
dc.identifier.citation | CRUZ, Michael Oliveira da. Applying language modeling to detect anomalies in bus trajectories. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/46345 | - |
dc.description.abstract | Discovering anomalous bus trajectories in urban traffic can help transportation agencies to improve their services by providing a better plan to deal with unexpected events such as weather phenomena, detours, or accidents. To help identifying the potential anomaly cause, we can detect anomalous trajectories and also pinpoint where the anomaly is located. However, a big challenge to performing this task is the lack of labeled anomalous trajectory data. The lack of labeled data hinders model evaluation, and the construction of inductive learning approaches. Additionally, previous approaches heavily rely on pre- processing tasks to segment trajectories before detecting the anomaly. This strategy is not only costly but also may lose important information because segments are analyzed individually without considering the relationship between segments. Lastly, only a few strategies in the literature propose online solutions, which restricts their real-time contribution. On this basis, this thesis aims to propose an online approach based on inductive learning to detect anomalous bus trajectories and pinpoint the anomalous segments. To do that, we initially observed that bus trajectories are pre-defined and well-formed, and they include route labels. Based on that, we supposed that a supervised approach could learn to classify those bus trajectories according to the routes and indirectly detect which ones are anomalous. Thus, we propose a multi-class classifier called Spatial-Temporal Outlier Detection as our first solution to detect anomalous trajectories. We use the uncertainty of the classification by applying the entropy function over the class distribution. Although extensive experiments have shown promising results, our first solution cannot pinpoint where the anomalous segments occur. To overcome that restriction, our intuition is that trajectories can be represented as a sequence of tokens similar to word sentences allowing us to apply a language model. Consequently, we propose using a deep generative encoder-decoder Transformer to learn the relationship between sequential trajectory points based on the self-attention mechanism. Our final solution does not require any manual feature extraction and can be easily adapted to other types of trajectories (e.g., car, people, and vessels). We have performed an extensive experimental evaluation that shows: (1) our approach is effective for both trajectory and sub-trajectory anomaly detection; and (2) it outperforms the baselines in some scenarios and statistically achieves comparable results in the others. | pt_BR |
dc.description.sponsorship | CNPq | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Modelos de linguagem | pt_BR |
dc.title | Applying language modeling to detect anomalies in bus trajectories | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/2220358686656766 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/7113249247656195 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | A descoberta de trajetórias anômalas de ônibus no tráfego urbano pode ajudar as agências de transporte a melhorar seus serviços, fornecendo um melhor planejamento para lidar com eventos inesperados, como fenômenos climáticos, desvios ou acidentes. Para ajudar a identificar a causa potencial da anomalia, podemos detectar trajetórias anômalas e também identificar onde a anomalia está localizada. No entanto, um grande desafio para realizar esta tarefa é a falta de datasets de trajetórias publicamente disponíveis. A falta desses dados rotulados para trajetórias anômalas também dificulta a avaliação de modelos e a construção de abordagens de aprendizagem indutivas. Além disso, as abordagens anteriores dependem fortemente de tarefas de pré-processamento para segmentar trajetórias antes de detectar a anomalia. Essa estratégia não é apenas cara, mas tam- bém pode perder informações importantes porque os segmentos são analisados individualmente sem considerar o relacionamento entre os segmentos. Por fim, poucas estratégias na literatura propõem soluções online, o que restringe sua contribuição em tempo real. Com base nisso, esta tese tem como objetivo propor uma abordagem online baseada em aprendizado indutivo para detectar trajetórias anômalas de ônibus e identificar os segmentos anômalos. Para isso, inicialmente observamos que as trajetórias de ônibus são pré-definidas e bem formadas, e incluem a informação de rotas. Com base nisso, supomos que uma abordagem supervisionada poderia aprender a classificar essas trajetórias de ônibus de acordo com as rotas e detectar indiretamente quais delas são anômalas. Assim, propomos um classificador multiclasse chamado Spatial-Temporal Outlier Detection como nossa primeira solução para detectar trajetórias anômalas. Usamos a incerteza da classificação aplicando a função de entropia sobre a distribuição de classes para gerar um score de anomalia. Embora experimentos extensivos tenham mostrado resultados promissores, nossa primeira solução não pode identificar onde ocorrem os segmentos anômalos. Para superar essa restrição, nossa intuição é que as trajetórias podem ser representadas como uma sequência de tokens semelhantes a frases de palavras que nos permitem aplicar um modelo de linguagem. Consequentemente, propomos usar uma abordagem baseada na arquitetura generativa de redes neuronais profundas chamada encoder-decoder Transformer para aprender a relação entre pontos de trajetória sequenciais com base no mecanismo de autoatenção. Nossa solução final não requer nenhuma extração manual de recursos e pode ser facilmente adaptada a outros tipos de trajetórias (por exemplo, carro, pessoas e embarcações). Realizamos uma extensa avaliação experimental que mostra: (1) nossa abordagem é eficaz para detecção de anomalias de trajetória e subtrajetória; e (2) supera os métodos usados para comparação em alguns cenários e alcança estatisticamente resultados comparáveis em outros cenários. | pt_BR |
Aparece nas coleções: | Teses de Doutorado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TESE Michael Oliveira da Cruz.pdf | 8,7 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons