Publicações

2025

Anomaly Detection and Root Cause Analysis in Cloud-Native Environments Using Large Language Models and Bayesian Networks
Diego Frazatto Pedroso, Luís Almeida, Lucas Eduardo Gulka Pulcinelli, William Akihiro Alves Aisawa, Inês Dutra, and Sarita Mazzini Bruschi
In: IEEE Access 13 (2025), pp. 77550–77564
[LINK]

2024

A Comprehensive Benchmark for 2D Convolution Primitive Evaluation
Lucas Alvarenga, Victor Ferrari, Rafael Souza, Marcio Pereira, and Guido Araujo
In: MLArchSys Workshop, ISCA 2024 Conference.
[LINK]
Integrating Multi-FPGA Acceleration to OpenMP Distributed Computing
Pedro Henrique Rosso, Lucian Petrica, Nusrat Jahan Lisa, Marcio Pereira, Sandro Rigo, Hervé Yviquel, Vanderlei Bonato, Emilio Francesquini and Guido Araujo
In: Espinosa, A., Klemm, M., de Supinski, B.R., Cytowski, M., Klinkenberg, J. (eds) Advancing OpenMP for Future Accelerators. IWOMP 2024. Lecture Notes in Computer Science, vol 15195. Springer, Cham
[LINK]
Combining Compression and Prefetching to Improve Checkpointing for Inverse Seismic Problems in GPUs
Thiago Maltempi, Sandro Rigo, Marcio Pereira, Hervé Yviquel, Jessé Costa, and Guido Araujo
In Euro-Par 2024: Parallel Processing: 30th European Conference on Parallel and Distributed Processing, Madrid, Spain, August 26–30, 2024, Proceedings, Part III. Springer-Verlag, Berlin, Heidelberg, 167–181.
[LINK]
DeepWave: A Software Stack for Parallelizing Deep Learning Models Used in Geophysics
A. Pinto, G. Leite, M. Pereira, H. Yviquel, S. Rigo and G. Araujo
2024 IEEE 36th International Symposium on Computer Architecture and High-Performance Computing (SBAC-PAD), Hilo, HI, USA, 2024, pp. 49-58
[LINK]
Ion-molecule collision cross-section calculations using trajectory parallelization in distributed systems
Samuel Cajahuaringa, Leandro N. Zanotto, Sandro Rigo, Hervé Yviquel, Munir S. Skaf, Guido Araujo
Journal of Parallel and Distributed Computing, Volume 191, 2024, 104902, ISSN 0743-7315
[LINK]
Programação com GPU/Aceleradores: Introdução à Programação CUDA
Denise Stringhini
2024, curso na Escola de Verão do Laboratório Nacional de Computação Científica, vídeo disponível em: www.youtube.com/watch?v=PvgTxSlDwQU
[LINK]

2023

Improving Convolution via Cache Hierarchy Tiling and Reduced Packing
Victor Ferrari, Rafael Sousa, Marcio Pereira, João P. L. de Carvalho, José Nelson Amaral, and Guido Araujo
2023, in Proceedings of the International Conference on Parallel Architectures and Compilation Techniques (PACT '22). Association for Computing Machinery, New York, NY, USA, 538–539
[LINK]
Source Matching and Rewriting for MLIR Using String-Based Automata
Vinicius Espindola, Luciano Zago, Hervé Yviquel, and Guido Araujo
2023 ACM Trans. Archit. Code Optim. 20, 2, Article 22 (June 2023), 26 pages
[LINK]
Advancing Direct Convolution Using Convolution Slicing Optimization and ISA Extensions
Victor Ferrari, Rafael Sousa, Marcio Pereira, João P. L. De Carvalho, José Nelson Amaral, José Moreira, and Guido Araujo
2023 ACM Trans. Archit. Code Optim. 20, 4, Article 54 (December 2023), 26 pages
[LINK]
A Self-distributing System Framework for the Computing Continuum
Roberto Rodrigues Filho, Renato S. Dias, João Seródio, Barry Porter, Fábio M. Costa, Edson Borin, Luiz F. Bittencourt
2023 in 32nd International Conference on Computer Communications and Networks (ICCCN 2023). Honolulu, HI, USA, [ACEITO]
[LINK]
Tensor slicing and optimization for multicore NPUs, Journal of Parallel and Distributed Computing
Rafael Sousa, Marcio Pereira, Yongin Kwon, Taeho Kim, Namsoon Jung, Chang Soo Kim, Michael Frank, Guido Araujo
Volume 175, 2023, Pages 66-79, ISSN 0743-7315
[LINK]
The OpenMP Cluster Programming Model
Hervé Yviquel, Marcio Pereira, Emílio Francesquini, Guilherme Valarini, Gustavo Leite, Pedro Rosso, Rodrigo Ceccato, Carla Cusihualpa, Vitoria Dias, Sandro Rigo, Alan Souza, and Guido Araujo
2023 in Workshop Proceedings of the 51st International Conference on Parallel Processing (ICPP Workshops '22). Association for Computing Machinery, New York, NY, USA, Article 17, 1–11
[LINK]
An OpenMP-only Linear Algebra Library for Distributed Architectures
C. Cardoso, H. Yviquel, G. Valarini, G. Leite, R. Ceccato, M. Pereira, A. Souza, G. Araujo
2022 International Symposium on Computer Architecture and High Performance Computing Workshops (SBAC-PADW), Bordeaux, France, 2022, pp. 17-24
[LINK]
A multiple linear regression approach for understanding the trade-offs in learning HPC job scheduling heuristics
Lucas de Sousa Rosa, Danilo Carastan-Santos, Alfredo Goldman

[LINK]
Evaluating execution time predictions on GPU kernels using an analytical model and machine learning techniques
Marcos Amaris, Raphael Camargo, Daniel Cordeiro, Alfredo Goldman, Denis Trystram
2023 Journal of Parallel and Distributed Computing, 171, 66-78
[LINK]

2022

Ion-Molecule Collision Cross-Section Simulation using Linked-cell and Trajectory Parallelization
Samuel Cajahuaringa, Leandro N. Zanotto, Daniel L. Z. Caetano, Sandro Rigo, Hervé Yviquel, Munir S. Skaf, Guido Araujo
2022 IEEE 34th International Symposium on Computer Architecture and High-Performance Computing (SBAC-PAD), Bordeaux, France, 2022, pp. 150-159
[LINK]
Special Issue on Compiling for Accelerators
G. Araujo and L. Wanner
2022, in IEEE Micro, vol. 42, no. 5, pp. 6-8, 1 Sept.-Oct. 2022
[LINK]
Using Barrier Elision to Improve Transactional Code Generation
Bruno Honorio, Joao P. L. de Carvalho, Catalina Morales, Alexandro Baldassin, Guido Araujo
2022 ACM Trans. Archit. Code Optim. 19, 3, Article 46 (September 2022), 23 pages
[LINK]
Implementing the Broadcast Operation in a Distributed Task-based Runtime
R. Ceccato, H. Yviquel, M. Pereira, A. Souza and G. Araujo,
2022 International Symposium on Computer Architecture and High Performance Computing Workshops (SBAC-PADW), Bordeaux, France, 2022, pp. 25-32
[LINK]
Parallelizing Git Checkout: a Case Study of I/O Parallelism
Matheus Tavares Bernardino and Alfredo Goldman
2022 IEEE 34th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), Bordeaux, France, 2022, pp. 293-304
[LINK]
Compiling Files in Parallel: A Study with GCC
Giuliano Belinassi; Richard Biener; Jan Hubička; Daniel Cordeiro; Alfredo Goldman
2022 International Symposium on Computer Architecture and High Performance Computing Workshops (SBAC-PADW), Bordeaux, France, 2022, pp. 1-8
[LINK]
Coisas para Fazer Antes de Paralelizar
Alfredo Goldman, Vitor Tessari Terra, Sarita Mazzini Bruschi .
in Minicursos do XXIII Simpósio em Sistemas Computacionais de Alto Desempenho, 2022, cap. 3
[LINK]
In search of efficient scheduling heuristics from simulations and Machine Learning
Lucas Rosa, Alfredo Goldman
2022, in Anais Estendidos do XXIII Simpósio em Sistemas Computacionais de Alto Desempenho, (pp. 17-24). Porto Alegre: SBC
[LINK]
Technical Debt Prioritization: A Developer's Perspective
Diogo Pina; Carolyn Seaman; Alfredo Goldman
2022 IEEE/ACM International Conference on Technical Debt (TechDebt), Pittsburgh, PA, USA, 2022, pp. 46-55
[LINK]
Coisas para Saber Antes de Fazer o Seu Próprio Benchmarks Game
Alfredo Goldman, Elisa Uhura, Sarita Mazzini Bruschi
2022, in Minicursos da XXII Escola Regional de Alto Desempenho da Região Sul (ERAD-RS 2022), Org. Arthur Lorenzon, Márcio Castro, Mauricio Pillon. (pp. 85-103). Porto Alegre: SBC
[LINK]
Prefácio e Organização dos Anais da XIII Escola Regional de Alto Desempenho de São Paulo
Hélio Crestana Guardia, Ricardo Menotti, Alfredo Goldman, Flávia Pisani
2022, Anais da XIII Escola Regional de Alto Desempenho de São Paulo. (pp. i-xi). São Carlos: SBC
[LINK]

2021

Accelerating Graph Applications Using Phased Transactional Memory
Catalina Morales, Rafael Murari, Joao P. L. de Carvalho, Bruno Honorio, Alexandro Baldassin and Guido Araujo
2021, in 27th Int. European Conference on Parallel and Distributed Computing (Euro-Par 2021), Sep. 2021
[LINK]
Efficient Tensor Slicing for Multicore NPUs using Memory Burst Modeling
R. Sousa, B. Jung, J. Kwak, M. Frank and G. Araujo,
2021 IEEE 33rd International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), Belo Horizonte, Brazil, 2021, pp. 84-93
[LINK]

Contribua com a Lista de Publicações

A lista de publicações no site visa divulgar os trabalhos relacionados ao projeto temático ou que usem recursos deste de algum modo, assim como trabalhos que usaram as máquinas do grupo. A lista também é usada para alimentar os relatórios periódicos do projeto.

Por essas razões, gostaríamos de contar com a ajuda de todos pesquisadores, colaboradores e usuários para manter a lista o mais completa, precisa e atualizada possível.

Pedimos que, nos casos acima, nos enviem periodicamente as informações à seguir sobre cada publicação:

O link oficial e/ou o DOI da da publicação.
Estamos apoiando a Ciência Aberta, então inclua também se possível um link da publicação completa em repositório aberto.

Créditos em Artigos e Outras Publicações

Trabalhos Realizados por Colaboradores do Projeto Temático

É necessário que o apoio da FAPESP através do projeto temático seja reconhecido em TODAS as publicações (artigos, teses, dissertações, trabalhos em anais de eventos, livros, páginas de internet, ou quais quer outras formas de difusão das atividades) que tenham se beneficiado desses recursos de algum modo.

Para incluir o reconhecimento à agência financiadora, use uma sentença como a seguinte:

Esta pesquisa é financiada por recursos do Projeto Temático FAPESP processo no 19/26702-8.

ou em inglês:

This research is funded by FAPESP grant #19/26702-8.

Segundo a FAPESP (vide link à seguir) "Os outorgados também são responsáveis por garantir que em toda publicação de materiais (incluindo páginas na internet) que resultem total ou parcialmente de Auxílio ou Bolsa, exceto artigos científicos publicados em revistas científicas ou técnicas com revisão por pares, conste a seguinte declaração de responsabilidade: "As opiniões, hipóteses e conclusões ou recomendações expressas neste material são de responsabilidade do(s) autor(es) e não necessariamente refletem a visão da FAPESP".

Mais informações na página da FAPESP.