Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс

^ Короткое содержание темы (тезисы):
В лекции приводится общая черта методов организации параллельных вычислений и дается различие меж многозадачным, параллельным и распределенным режимами выполнения программ. Для демонстрации вероятных подходов рассматривается ряд примеров параллельных вычислительных Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс систем и отмечается существенное обилие вариантов построения параллельных систем.

Обилие компьютерных вычислительных систем приводит к необходимости их систематизации. В лекции дается описание 1-го из более узнаваемых методов – систематики Флинна, в базу которой Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс положено понятие потоков команд и данных. Данная систематизация является довольно обычной и понятной, но в рамках такового подхода практически все многопроцессорные вычислительные системы попадают в одну группу – класс MIMD. С целью предстоящего Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс разделения вероятных типов систем в лекции приводится также обширно применяемая структуризация класса многопроцессорных вычислительных систем, что позволяет выделить две принципиальные группы систем с общей разделяемой и распределенной памятью – мультипроцессоры и мультикомпьютеры. Более известные примеры Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс систем первой группы — векторные параллельные микропроцессоры (parallel vector processor либо PVP) и симметричные мультипроцессоры (symmetric multiprocessor либо SMP). К мультикомпьютерам относятся массивно-параллельные системы (massively parallel processor либо MPP Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс) и кластеры (clusters).

Дальше в лекции обращается внимание на характеристику сетей передачи данных в многопроцессорных вычислительных системах. Приводятся примеры топологий сетей, отмечаются особенности организации сетей передачи данных в кластерах и дискуссируются характеристики Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс топологий, значительно действующие на коммуникационную сложность способов параллельных вычислений.

В окончание лекции дается общая черта системных платформ для построения кластеров.

^ Задания для самоконтроля:

  1. Приведите дополнительные примеры параллельных вычислительных систем.

  2. Разглядите дополнительные методы Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс систематизации компьютерных систем.

  3. Разглядите методы обеспечения когерентности кэшей в системах с общей разделяемой памятью.

  4. Подготовьте обзор программных библиотек, обеспечивающих выполнение операций передачи данных для систем с распределенной памятью.

  5. Разглядите топологию сети передачи данных в виде Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс двоичного дерева.

  6. Выделите отлично реализуемые классы задач для каждого типа топологий сети передачи данных.


Литература:

Дополнительная информация об архитектуре параллельных вычислительных систем может быть получена, к примеру, из [2, 11, 14, 28, 45, 59]; нужная информация Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс содержится также в [24, 76].

В качестве обзора вероятных топологий сетей передачи данных в многопроцессорных системах и технологий для их реализации может быть рекомендована, к примеру, работа [29].

Подробное рассмотрение вопросов, связанных с построением и внедрением Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс кластерных вычислительных систем, проводится в [24, 76]. Практические советы по построению кластеров для различных системных платформ могут быть найдены в [70, 71].


2.2. Раздел Анализ эффективности параллельных вычислений


Тема 2. Моделирование и анализ параллельных вычислений


Цель лекции: обрисовать Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс модель вычислений в виде графа "операции – операнды". Приводить главные характеристики свойства параллельных способов — ускорение (speedup), эффективность (efficiency), цена (cost) и масштабируемость (scalability) вычислений.


Вопросы к теме:

  1. Как определяется модель "операции — операнды"?

  2. Как определяется Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс расписание для рассредотачивания вычислений меж микропроцессорами?

  3. Как определяется время выполнения параллельного метода?

  4. Какое расписание является хорошим?

  5. Как найти мало вероятное время решения задачки?

  6. Что понимается под паракомпьютером и зачем возможно окажется полезным данное Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс понятие?

  7. Какие оценки следует использовать в качестве свойства времени поочередного решения задачки?

  8. Как найти мало вероятное время параллельного решения задачки по графу "операнды – операции"?

  9. Какие зависимости могут быть получены для времени параллельного решения Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс задачки при увеличении либо уменьшении числа применяемых микропроцессоров?

  10. При каком числе микропроцессоров могут быть получены времена выполнения параллельного метода, сопоставимые по порядку с оценками мало вероятного времени решения задачки Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс?

  11. Как определяются понятия ускорения и эффективности?

  12. Может быть ли достижение сверхлинейного ускорения?

  13. В чем состоит противоречивость характеристик ускорения и эффективности?

  14. Как определяется понятие цены вычислений?

  15. В чем состоит понятие стоимостно-оптимального метода?

  16. В Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс чем заключается неувязка распараллеливания поочередного метода суммирования числовых значений?

  17. В чем состоит каскадная схема суммирования? С какой целью рассматривается измененный вариант данной схемы?

  18. В чем состоит различие характеристик ускорения и эффективности для Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс рассматриваемых вариантов каскадной схемы суммирования?

  19. В чем состоит параллельный метод вычисления всех личных сумм последовательности числовых значений?

  20. Как формулируется закон Амдаля? Какой нюанс параллельных вычислений позволяет учитывать данный закон?

  21. Какие догадки употребляются Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс для обоснования закона Густавсона – Барсиса?

  22. Как определяется функция изоэффективности?

  23. Какой метод является масштабируемым? Приведите примеры способов с различным уровнем масштабируемости.


Короткое содержание темы (тезисы):

В лекции рассматривается модель вычислений в виде графа "операции Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс – операнды", которая может употребляться для описания имеющихся информационных зависимостей в избираемых методах решения задач.

В базу данной модели положен ациклический направленный граф, в каком верхушки представляют операции, а дуги соответствуют зависимостям операций по Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс данным. При наличии такового графа для определения параллельного метода довольно задать расписание, в согласовании с которым фиксируется рассредотачивание выполняемых операций по микропроцессорам.

Представление вычислений с помощью моделей подобного вида позволяет Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс получить аналитически ряд черт разрабатываемых параллельных алгоритмов, посреди которых время выполнения, схема рационального расписания, оценки очень вероятного быстродействия способов решения намеченных целей. Для более обычного построения теоретических оценок в лекции рассматривается Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс понятие паракомпьютера как параллельной системы с неограниченным количеством микропроцессоров.

Для оценки оптимальности разрабатываемых способов параллельных вычислений в лекции приводятся обширно применяемые в теории и практике параллельного программирования главные характеристики свойства - ускорение (speedup Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс), показывающее, во сколько раз резвее осуществляется решение задач при использовании нескольких микропроцессоров, и эффективность (efficiency), которая охарактеризовывает долю времени реального использования микропроцессоров вычислительной системы. Принципиальной чертой разрабатываемых алгоритмов является цена (cost) вычислений Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс, определяемая как произведение времени параллельного решения задачки и числа применяемых микропроцессоров.

Для демонстрации применимости рассмотренных моделей и способов анализа параллельных алгоритмов в лекции рассматривается задачка нахождения личных сумм последовательности числовых значений. На Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс данном примере отмечается неувязка трудности распараллеливания поочередных алгоритмов, которые вначале не были нацелены на возможность организации параллельных вычислений. Для выделения "укрытого" параллелизма показывается возможность преобразования начальной поочередной схемы вычислений и приводится получаемая Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс в итоге таких преобразований каскадная схема. На примере этой же задачки отмечается возможность введения лишних вычислений для заслуги большего параллелизма выполняемых расчетов.

В окончание лекции рассматривается вопрос построения оценок очень достижимых значений Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс характеристик эффективности. Для получения таких оценок может быть применен закон Амдала (Amdahl), позволяющий учитывать существование поочередных (нераспараллеливаемых) вычислений в способах решения задач. Закон Густавсона – Барсиса (Gustafson – Barsis's law) обеспечивает построение оценок ускорения масштабирования (scaled Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс speedup), используемое для свойства того, как отлично могут быть организованы параллельные вычисления при увеличении трудности решаемых задач. Для определения зависимости меж сложностью решаемой задачки и числом микропроцессоров, при соблюдении Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс которой обеспечивается нужный уровень эффективности параллельных вычислений, вводится понятие функции изоэффективности (isoefficiency function).


Задания для самоконтроля:

1. Разработайте модель и сделайте оценку характеристик ускорения и эффективности параллельных вычислений:







2. Сделайте в согласовании с законом Амдала оценку очень достижимого ускорения Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс для задач п. 1.

3. Сделайте оценку ускорения масштабирования для задач п.1.

4. Сделайте построение функций изоэффективности для задач п.1.

5. Разработайте модель и сделайте полный анализ эффективности параллельных вычислений (ускорение, эффективность, очень достижимое ускорение, ускорение масштабирования, функция Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс изоэффективности) для задачки умножения матрицы на вектор.


Литература:

Дополнительная информация по моделированию и анализу параллельных вычислений может быть получена, к примеру, в [2, 22], нужная информация содержится также в [51, 63].

Рассмотрение учебной Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс задачки суммирования последовательности числовых значений было выполнено в [22].

В первый раз закон Амдала был изложен в работе [18]. Закон Густавсона – Барсиса был размещен в работе [43]. Понятие функции изоэффективности было предложено в работе [39].

Систематическое изложение (на момент Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс издания работы) вопросов моделирования и анализа параллельных вычислений приводится в [77].


^ Тема 3. Оценка коммуникационной трудозатратности параллельных алгоритмов


Цель лекции: Посветить вопросам анализа информационных потоков, возникающих при выполнении параллельных алгоритмов. Дать общую характеристику Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс устройств передачи данных, проводить анализ трудозатратности главных операций обмена информацией, рассматривать способы логического представления структуры многопроцессорных вычислительных систем


Вопросы к теме:

  1. Какие главные свойства употребляются для оценки топологии сети передачи данных? Приведите значения Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс черт для определенных типов коммуникационных структур (полный граф, линейка, решетка и др.).

  2. Какие главные способы используются при маршрутизации передаваемых данных по сети?

  3. В чем состоят главные способы передачи данных? Приведите для этих способов аналитические Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс оценки времени выполнения.

  4. Какие операции передачи данных могут быть выделены в качестве главных?

  5. В чем состоят методы выполнения передачи данных от 1-го микропроцессора всем микропроцессорам сети для топологий кольца, решетки и Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс гиперкуба? Приведите оценки временной трудозатратности для этих алгоритмов.

  6. В чем состоят методы выполнения передачи данных от всех микропроцессоров всем микропроцессорам сети для топологий кольца, решетки и гиперкуба? Приведите оценки временной трудозатратности для этих Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс алгоритмов.

  7. В чем состоят вероятные методы выполнения операции редукции? Какой из алгоритмов является лучшим по времени выполнения?

  8. В чем состоит метод выполнения операции повторяющегося сдвига?

  9. В чем состоит полезность использования Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс логических топологий? Приведите примеры алгоритмов логического представления структуры коммуникационной сети.

  10. В чем состоит различие моделей для оценки времени выполнения операций передачи данных в кластерных вычислительных системах? Какая модель является более четкой? Какая модель может Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс быть применена для подготовительного анализа временной трудозатратности коммуникационных операций?


Короткое содержание темы (тезисы):

Данная лекция посвящена оценке коммуникационной трудности параллельных алгоритмов.

В подразделе 3.1 представлена общая черта алгоритмов маршрутизации и способов передачи Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс данных. Для подробного рассмотрения выделены способ передачи сообщений и способ передачи пакетов, для которых определены оценки времени выполнения коммуникационных операций.

В подразделе 3.2 определены главные типы операций передачи данных, выполняемых в процессе параллельных Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс вычислений. К главным коммуникационным операциям относятся:

Для всех перечисленных операций передачи данных рассмотрены методы Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс их выполнения на примере топологий кольца, решетки и гиперкуба. Для каждого из представленных алгоритмов приведены оценки их временной трудозатратности как для способа передачи сообщений, так и для способа передачи пакетов.

В Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс подразделе 3.3 рассмотрены способы логического представления топологий на базе определенных (физических) межпроцессорных структур. Внедрение логических топологий позволяет получить более обычное изложение для ряда алгоритмов передачи данных, понизить издержки на реализацию коммуникационных операций и Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс т.п.

В подразделе 3.4 более тщательно дискуссируются модели, с помощью которых могут быть получены оценки времени выполнения операций передачи данных для кластерных вычислительных систем. Точность формирования временных оценок сравнивается с помощью проведения Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс вычислительных тестов. По результатам тестов определена более четкая модель (модель B). Не считая того, отмечается, что для подготовительного анализа временной трудозатратности коммуникационных операций целенаправлено использовать более ординарную модель – модель C (модель Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс Хокни).


Задания для самоконтроля:

  1. Разработайте методы выполнения главных операций передачи данных для топологии сети в виде 3-мерной решетки.

  2. Разработайте методы выполнения главных операций передачи данных для топологии сети в виде двоичного дерева Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс.

  3. Примените модель B из подраздела 3.4 для оценки временной трудности операций передачи данных. Сравните получаемые характеристики.

  4. Примените модель C из подраздела 3.4 для оценки временной трудности операций передачи данных. Сравните получаемые характеристики.

  5. Разработайте методы Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс логического представления двоичного дерева для разных физических топологий сети.


Литература:

В качестве дополнительного учебного материала для данной лекции могут быть рекомендованы работы [51, 63].

Вопросы построения моделей для оценки времени выполнения коммуникационных операций обширно дискуссируются в литературе Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс. При исследовании лекции могут быть полезны работы [5, 28, 68]. Модель Хокни в первый раз была размещена в [46]. Модель B из подраздела 3.4 представлена в работе [3].


2.3. Раздел Формирование общих принципов разработки параллельных алгоритмов

Тема 4. Принципы Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс разработки параллельных способов


Цель лекции: Разглядеть базисные принципы разработки параллельных алгоритмов. Обрисовывать главные понятия, тщательно разбираются все этапы сотворения и анализа параллельных алгоритмов. Приводить пример внедрения обсуждаемых способов


Вопросы к теме:

  1. В чем состоят начальные догадки Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс для способности внедрения рассмотренной в лекции методики разработки параллельных алгоритмов?

  2. Каковы главные этапы проектирования и разработки способов параллельных вычислений?

  3. Как определяется модель "подзадачи – сообщения"?

  4. Как определяется модель "процессы – каналы"?

  5. Какие главные Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс требования должны быть обеспечены при разработке параллельных алгоритмов?

  6. В чем состоят главные деяния на шаге выделения подзадач?

  7. Каковы главные деяния на шаге определения информационных зависимостей?

  8. В чем состоят главные деяния на шаге масштабирования Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс имеющегося набора подзадач?

  9. В чем состоят главные деяния на шаге рассредотачивания подзадач по микропроцессорам вычислительной системы?

  10. Как происходит динамическое управление рассредотачиванием вычислительной нагрузки с помощью схемы "менеджер – исполнитель"?

  11. Какой Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс способ параллельных вычислений был разработан для решения гравитационной задачки N тел?

  12. Какой метод выполнения операции обобщенного сбора данных является более действенным?


Короткое содержание темы (тезисы):

В лекции подверглась рассмотрению методика разработки параллельных алгоритмов Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс, предложенная в [32]. Она содержит в себе этапы выделения подзадач, определения информационных зависимостей, масштабирования и рассредотачивания подзадач по микропроцессорам вычислительной системы. При использовании методики подразумевается, что вычислительная схема решения рассматриваемой задачки уже является Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс известной. Главные требования, которые должны быть обеспечены при разработке параллельных алгоритмов, состоят в равномерной загрузке микропроцессоров при низком информационном содействии сформированного огромного количества подзадач.

Для описания получаемых в процессе разработки вычислительных параллельных схем рассмотрены Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс две модели. 1-ая из их – модель "подзадачи – сообщения" может быть применена на стадии проектирования параллельных алгоритмов, 2-ая — модель "процессы – каналы" – может быть использована на стадии реализации способов в виде параллельных программ Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс.

В окончание раздела показывается применение рассмотренной методики разработки параллельных алгоритмов на примере решения гравитационной задачки N тел.


Задания для самоконтроля:

1. Разработайте схему параллельных вычислений, используя рассмотренную в разделе методику проектирования и разработки Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс параллельных способов:



(обратите повышенное внимание на ситуацию, когда число микропроцессоров превосходит размер матрицы, т.е Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс. p>N);



(описание способов интегрирования дано, к примеру, в [47]).

2. Разработайте схему параллельных вычислений для задачки умножения матрицы на вектор, используя рассмотренную в разделе Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс методику проектирования и разработки параллельных способов.


Литература:

Рассмотренная в лекции методика разработки параллельных алгоритмов в первый раз была предложена в [32]. В этой работе изложение методики проводится более детально, не считая того, в Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс ней содержится несколько примеров ее использования для разработки параллельных способов для решения ряда вычислительных задач.

Полезной при рассмотрении вопросов проектирования и разработки параллельных алгоритмов возможно окажется также работа [63].

Гравитационная задачка N Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс тел более тщательно рассматривается в [5].


2.4. Раздел Создание и развитие системного программного обеспечения для параллельных вычислительных систем


Тема 5. Параллельное программирование на базе MPI


Цель лекции: Разглядеть эталон для программирования в системах с распределенной Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс памятью MPI. Дать обзор истории появления и развития эталона, также перечислять его главные способности. Привадить примеры программ, использующих рассматриваемый эталон


Вопросы к теме:

  1. Какой малый набор средств является достаточным для организации параллельных вычислений в системах с Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс распределенной памятью?

  2. В чем состоит значимость стандартизации средств передачи сообщений?

  3. Что следует осознавать под параллельной программкой?

  4. В чем различие понятий процесса и микропроцессора?

  5. Какой малый набор функций MPI позволяет Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс начать разработку параллельных программ?

  6. Как описываются передаваемые сообщения?

  7. Как можно организовать прием сообщений от определенных процессов?

  8. Как найти время выполнения MPI-программы?

  9. В чем различие парных и коллективных операций передачи данных?

  10. Какая функция Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс MPI обеспечивает передачу данных от 1-го процесса всем процессам?

  11. Что понимается под операцией редукции?

  12. В каких ситуациях следует использовать барьерную синхронизацию?

  13. Какие режимы передачи данных поддерживаются в MPI?

  14. Как организуется неблокирующий обмен данными в Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс MPI?

  15. В чем состоит понятие тупика? Когда функция одновременного выполнения передачи и приема гарантирует отсутствие тупиковых ситуаций?

  16. Какие коллективные операции передачи данных предусмотрены в MPI?

  17. Что понимается под производным типом Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс данных в MPI?

  18. Какие методы конструирования типов имеются в MPI?

  19. В каких ситуациях может быть полезна упаковка и распаковка данных?

  20. Что понимается в MPI под коммуникатором?

  21. Зачем может потребоваться создание новых коммуникаторов?

  22. Что понимается Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс в MPI под виртуальной топологией?

  23. Какие виды топологий предусмотрены в MPI?

  24. Зачем возможно окажется полезным внедрение виртуальных топологий?

  25. В чем состоят особенности разработки параллельных программ с внедрением MPI на Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс алгоритмическом языке Fortran?

  26. Какие главные дополнительные способности предусмотрены в эталоне MPI-2?


Короткое содержание темы (тезисы):

Данная лекция посвящена рассмотрению способов параллельного программирования для вычислительных систем с распределенной памятью с внедрением MPI.

В самом начале Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс лекции отмечается, что ^ MPI – интерфейс передачи сообщений (message passing interface) – является в реальный момент одним из главных подходов к разработке параллельных программ для вычислительных систем с распределенной памятью. Внедрение MPI позволяет распределить вычислительную Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс нагрузку и организовать информационное взаимодействие (передачу данных) меж микропроцессорами. Сам термин MPI значит, с одной стороны, эталон, которому должны удовлетворять средства организации передачи сообщений, а с другой стороны, обозначает Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс программные библиотеки, которые обеспечивают возможность передачи сообщений и при всем этом соответствуют всем требованиям эталона MPI.

В подразделе 5.1 рассматривается ряд понятий и определений, являющихся основополагающими для эталона ^ MPI. Так, дается представление о Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс параллельной программке> как огромном количестве сразу выполняемых процессов. При всем этом процессы могут производиться на различных микропроцессорах, но на одном микропроцессоре могут размещаться и несколько процессов (в данном случае их выполнение осуществляется Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс в режиме разделения времени). Дальше приводится короткая черта понятий для операций передачи сообщений, типов данных, коммуникаторов и виртуальных топологий.

В подразделе 5.2 проводится резвое и обычное введение в разработку параллельных программ с внедрением MPI. Излагаемого Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс в подразделе материала довольно для начала разработки параллельных программ различного уровня трудности.

В подразделе 5.3 излагается материал, связанный с операциями передачи данных меж 2-мя процессами. Тут тщательно характеризуются имеющиеся в MPI режимы выполнения операций Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс – стандартный, синхронный, буферизованный, по готовности. Для всех рассмотренных операций дискуссируется возможность организации неблокирующих обменов данными меж процессами.

В подразделе 5.4 рассматриваются коллективные операции передачи данных. Изложение материала соответствует последовательности исследования Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс коммуникационных операций, использованной в теме 3. Основной вывод данного подраздела заключается в том, что MPI обеспечивает поддержку фактически всех главных операций информационных обменов меж процессами.

В подразделе 5.5 излагается материал, связанный с внедрением в ^ MPI производных Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс типов данных. В подразделе представлены все главные методы конструирования производных типов – непрерывный, векторный, индексный и структурный. Дискуссируется также возможность очевидного формирования сложных сообщений с помощью упаковки и распаковки данных.

В подразделе 5.6 дискуссируются Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс вопросы управления группами процессов и коммуникаторами. Рассматриваемые в подразделе способности MPI позволяют управлять областями деяния коллективных операций и исключить взаимовлияние различных выполняемых частей параллельной программки.

В подразделе 5.7 рассматриваются способности ^ MPI по использованию Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс виртуальных топологий. В подразделе представлены топологии, поддерживаемые MPI, – прямоугольная решетка случайной размерности (декартова топология) и топология графа хоть какого нужного вида.

В подразделе 5.8 приводятся дополнительные сведения о MPI. В числе их дискуссируются вопросы Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс разработки параллельных программ с внедрением MPI на алгоритмическом языке Fortran, дается короткая черта сред выполнения MPI-программ и приводится обзор дополнительных способностей эталона MPI-2.


Задания для самоконтроля:

Подраздел 5.2.

1. Разработайте программку для Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс нахождения малого (наибольшего) значения посреди частей вектора.

2. Разработайте программку для вычисления скалярного произведения 2-ух векторов.

3. Разработайте программку, в какой два процесса неоднократно обмениваются сообщениями длиной n б. Сделайте опыты и оцените зависимость времени Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс выполнения операции передачи данных от длины сообщения. Сравните с теоретическими оценками, построенными по модели Хокни.

Подраздел 5.3.

4. Подготовьте варианты ранее разработанных программ с различными режимами выполнения операций передачи данных. Сравните время выполнения операций Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс передачи данных при различных режимах работы.

5. Подготовьте варианты ранее разработанных программ с внедрением неблокирующего метода выполнения операций передачи данных. Оцените количество вычислительных операций, нужное для того, чтоб вполне скооперировать передачу данных и Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс вычисления. Разработайте программку, в какой бы вполне отсутствовали задержки вычислений из-за ожидания передаваемых данных.

6. Сделайте задание 3 с внедрением операции одновременного выполнения передачи и приема данных. Сравните результаты вычислительных Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс тестов.

Подраздел 5.4.

7. Разработайте программу-пример для каждой имеющейся в MPI коллективной операции.

8. Разработайте реализации коллективных операций с помощью парных обменов меж процессами. Сделайте вычислительные опыты и сравните время выполнения разработанных программ и функций MPI для Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс коллективных операций.

9. Разработайте программку, сделайте опыты и сравните результаты для различных алгоритмов реализации операции сбора, обработки и рассылки данных всех процессам (функция MPI_Allreduce).

Подраздел 5.5.

10. Разработайте программу-пример для каждого Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс имеющегося в MPI метода конструирования производных типов данных.

11. Разработайте программу-пример с внедрением функций упаковки и распаковки данных. Сделайте опыты и сравните с плодами при использовании производных типов данных.

12. Разработайте производные типы данных для Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс строк, столбцов, диагоналей матриц.

13. Разработайте программу-пример для каждой из рассмотренных функций для управления процессами и коммуникаторами.

14. Разработайте программку для представления огромного количества процессов в виде прямоугольной решетки. Сделайте коммуникаторы для каждой Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс строчки и столбца процессов. Сделайте коллективную операцию для всех процессов и для 1-го из сделанных коммуникаторов. Сравните время выполнения операции.

15. Изучите без помощи других и разработайте программы-примеры для Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс передачи данных меж процессами различных коммуникаторов.

Подраздел 5.7.

16. Разработайте программу-пример для декартовой топологии.

17. Разработайте программу-пример для топологии графа.

18. Разработайте подпрограммы для сотворения некого набора дополнительных виртуальных топологий (звезда, дерево и др.).


Литература Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс:

Имеется ряд источников, в каких может быть получена информация о ^ MPI. Сначала, это информационный ресурс Веб с описанием эталона MPI: http://www.mpiforum.org/. Одна из более всераспространенных реализаций MPI – библиотека MPICH – представлена Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс на http://www-unix.mcs.anl.gov/mpi/mpich (библиотека MPICH2 с реализацией эталона MPI-2 содержится на http://www-unix.mcs.anl.gov/mpi/mpich2). Русские материалы о MPI имеются на веб Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс-сайте http://www.parallel.ru/.

Посреди размещенных изданий могут быть рекомендованы работы [4, 40 – 42, 57]. Описание эталона MPI-2 может быть получено в [42]. Посреди русских изданий могут быть рекомендованы работы [2, 4, 12].

Необходимо подчеркнуть также работу [63], в какой Краткое содержание темы (тезисы) - 2. Раздел лекционный комплекс исследование MPI проводится на примере ряда типовых задач параллельного программирования – матричных вычислений, сортировки, обработки графов и др.


^ 2.5. Раздел Создание и развитие параллельных алгоритмов




kratkoe-soderzhanie-1-stranica-10.html
kratkoe-soderzhanie-1-stranica-5.html
kratkoe-soderzhanie-1.html