Синев Тимур. Технология OMP. Умножение плотных матриц. Элементы типа double. Блочная схема, алгоритм Кэннона. Вариант 1 by Tsinev · Pull Request #370 · learning-process/ppc-2026-threads

Tsinev · 2026-03-16T21:20:33Z

Задача: Умножение плотных матриц. Элементы типа double. Блочная схема, алгоритм Кэннона.
Вариант: 1
Технология: OMP
Реализация: последовательная версия умножения матриц по алгоритму Кэннона с автоматическим выбором размера блока

Описание

В данной работе реализована параллельная версия алгоритма Кэннона для перемножения квадратных матриц с использованием технологии OpenMP. Алгоритм базируется на разбиении данных на блоки и их циклическом перемещении, что позволяет эффективно распределить вычислительную нагрузку между потоками и оптимизировать работу с кэш-памятью.

Основные детали решения

Параллельное блочное представление Исходные матрицы $A$ и $B$ преобразуются в четырехмерные структуры (сетки блоков). В отличие от последовательной версии, распределение данных (DistributeData) выполняется параллельно с помощью директивы #pragma omp parallel for collapse(2). Это позволяет одновременно заполнять блоки для разных позиций сетки, ускоряя инициализацию.
Начальное распределение (Initial Alignment)
Перед началом вычислений выполняется предварительный сдвиг блоков:

блок A(i, j) выбирается с учётом смещения по строке;
блок B(i, j) — с учётом смещения по столбцу.
Параллельная реализация этого этапа гарантирует, что каждый поток подготавливает свою часть данных для первого шага вычислений без конфликтов записи.

Итеративный процесс и многопоточное умножение
Основной цикл вычислений состоит из q шагов (где q = n block_size):

Параллельное умножение блоков: На каждом шаге используется #pragma omp parallel for collapse(2), что позволяет распределить вычисления пар блоков (i, j) между доступными ядрами процессора.
Локальная оптимизация: Внутри функции BlockMultiplyAccumulate сохраняется эффективный порядок обхода i–k–j, что критически важно для производительности в многопоточном режиме, так как уменьшает нагрузку на шину памяти.
Параллельная ротация: После перемножения блоки матрицы A сдвигаются влево, а матрицы B — вверх. Эти операции также распараллелены, что минимизирует простои потоков между вычислительными фазами.

Синхронизация и управление памятью

Безопасность потоков: Использование default(none) и явное указание shared переменных в директивах OpenMP гарантирует отсутствие состояний гонки (race conditions).
Zero-copy подход: Для ротации блоков применяется std::move. В сочетании с OpenMP это позволяет быстро перераспределять указатели на блоки между итерациями, не нагружая систему лишним копированием данных в памяти.
Сборка результата: Финальная матрица формируется параллельно в методе CollectResult, где каждый поток копирует вычисленные блоки в соответствующие области результирующего массива.

Валидация

Программа выполняет проверку входных параметров перед запуском параллельной секции:
Проверка на квадратную форму и кратность размера матрицы размеру блока.
Контроль корректности выделения памяти под сетку блоков для предотвращения сбоев в многопоточной среде.

Чек-лист

Статус CI: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке
Директория и именование задачи: Я создал директорию с именем <фамилия>_<первая_буква_имени>_<короткое_название_задачи>
Полное описание задачи: Я предоставил полное описание задачи в теле pull request
clang-format: Мои изменения успешно проходят clang-format локально в моем форке (нет ошибок форматирования)
clang-tidy: Мои изменения успешно проходят clang-tidy локально в моем форке (нет предупреждений/ошибок)
Функциональные тесты: Все функциональные тесты успешно проходят локально на моей машине
Тесты производительности: Все тесты производительности успешно проходят локально на моей машине
Ветка: Я работаю в ветке, названной точно так же, как директория моей задачи (например, nesterov_a_vector_sum), а не в master
Правдивое содержание: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и достоверными

codecov-commenter · 2026-03-17T01:43:56Z

Codecov Report

❌ Patch coverage is 80.00000% with 8 lines in your changes missing coverage. Please review.
✅ Project coverage is 79.17%. Comparing base (97dd371) to head (e4cad3a).

Files with missing lines	Patch %	Lines
tasks/timur_a_cannon/omp/src/ops_omp.cpp	79.48%	8 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##           master     #370      +/-   ##
==========================================
+ Coverage   79.16%   79.17%   +0.01%     
==========================================
  Files         267      269       +2     
  Lines        9325     9365      +40     
  Branches     3963     3979      +16     
==========================================
+ Hits         7382     7415      +33     
- Misses       1374     1382       +8     
+ Partials      569      568       -1

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

Tsinev added 16 commits March 16, 2026 20:53

omp1

06de78e

omp1

3f61c7d

omp1

3042dec

omp1

418fde9

omp3

b7712c0

omp2

12f6222

omp3

b662fd4

omp3

1aeaff9

omp1

bf0bed4

omp1

a7c657d

omp1

e1877d4

omp1

c1a704e

omp1

3dee953

omp8

25db9c2

omp8

f8a1288

omp8

57d3e1a

Tsinev requested a review from allnes as a code owner March 16, 2026 21:20

github-actions bot added task:omp task labels Mar 16, 2026

Tsinev added 7 commits March 17, 2026 01:12

omp8

9efdb59

omp10

8061f6b

omp11

33b89ee

omp13

ea46158

omp888

883e88d

NICE EREMA

40630d1

NICE EREMA

37e7da5

Tsinev added 3 commits March 17, 2026 18:24

ompF1

4167628

ompF2

b8d715d

ompF3

e42c0d4

Tsinev added 18 commits March 17, 2026 21:32

ompF5

3f7a457

ompF6

e8461a1

ompF8

bc75544

ompF88

486729b

ompF888

82c684e

ompF8888

2a78c5d

ompF88888

dbd3751

ompxd

925aebe

ompxd

753623b

w

2bf0eb8

ww

d4b4aaa

www

bb728cd

WWWW

b6b5592

88

3206d56

888

4a53c76

888

e4cad3a

gg

8f4f3cf

ggs

a59a8a4

github-actions bot added the task:seq label Mar 19, 2026

ggs

f32c6e9

Tsinev closed this Mar 19, 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Синев Тимур. Технология OMP. Умножение плотных матриц. Элементы типа double. Блочная схема, алгоритм Кэннона. Вариант 1#370

Tsinev commented Mar 16, 2026

Uh oh!

codecov-commenter commented Mar 17, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

Tsinev commented Mar 16, 2026

Описание

Основные детали решения

Чек-лист

Uh oh!

codecov-commenter commented Mar 17, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

codecov-commenter commented Mar 17, 2026 •

edited

Loading