Skip to content

Синев Артём. Технология OMP. Умножение плотных матриц. Элементы типа double. Блочная схема, алгоритм Фокса. Вариант 2.#367

Open
SinevArtem wants to merge 9 commits intolearning-process:masterfrom
SinevArtem:sinev_a_mult_matrix_fox_algorithm_omp

Conversation

@SinevArtem
Copy link
Contributor

@SinevArtem SinevArtem commented Mar 16, 2026

Описание

  • Задача: Элементы типа double. Блочная схема, алгоритм Фокса
  • Вариант: 2
  • Технология: OMP
  • Описание: Разработана параллельная программа на C++ с использованием OpenMP, реализующая алгоритм Фокса для умножения квадратных матриц размером n×n (элементы double).
    Ключевые особенности реализации:
    1. Блочное разбиение: Матрицы A, B и C разбиваются на блоки размером bs×bs, организуясь в виртуальную сетку q×q, где q = n/bs. Размер блока выбирается как наибольший делитель n, обеспечивающий равномерное разбиение.
    2. Хранение данных: Все блоки хранятся в единых линейных массивах blocksA, blocksB, blocksC, что обеспечивает эффективный доступ к памяти и исключает необходимость в сложных структурах данных.
    3. Параллельная декомпозиция:
      Разложение исходных матриц на блоки выполняется с использованием #pragma omp parallel for collapse(2)
      Сборка результирующей матрицы из блоков также распараллелена
    4. Алгоритмическая логика:
      Выполняется q итераций (step = 0..q-1)
      На каждой итерации для каждого блока C[i][j] выбирается блок A[i][k], где k = (i + step) % q, и блок B[k][j]
      Выполняется умножение блоков с накоплением результата в blocksC[i][j]
    5. Оптимизация:
      Директива collapse(2) обеспечивает равномерное распределение работы между потоками
      Локальность данных благодаря хранению блоков в линейных массивах
      Автоматический выбор размера блока, обеспечивающий целочисленное разбиение

Чек-лист

  • Статус CI: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке
  • Директория и именование задачи: Я создал директорию с именем <фамилия>_<первая_буква_имени>_<короткое_название_задачи>
  • Полное описание задачи: Я предоставил полное описание задачи в теле pull request
  • clang-format: Мои изменения успешно проходят clang-format локально в моем форке (нет ошибок форматирования)
  • clang-tidy: Мои изменения успешно проходят clang-tidy локально в моем форке (нет предупреждений/ошибок)
  • Функциональные тесты: Все функциональные тесты успешно проходят локально на моей машине
  • Тесты производительности: Все тесты производительности успешно проходят локально на моей машине
  • Ветка: Я работаю в ветке, названной точно так же, как директория моей задачи
    (например, nesterov_a_vector_sum), а не в master
  • Правдивое содержание: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и
    достоверными

SinevArtem added 2 commits March 16, 2026 20:58
@SinevArtem SinevArtem requested a review from allnes as a code owner March 16, 2026 18:09
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant