Впереди планеты всей
Компания IBM создала первый в мире двухнанометровый чип, демонстрирующий существенный прирост производительности в сравнении с распространенными сейчас семинанометровыми. Как пишет Engadget, IBM смогла уместить 50 млрд транзисторов на кристалле размером с ноготь.
По данным ZDnet, у IBM готовы пока только тестовые образцы новых чипов – на массовое производство в ближайшем будущем компания не рассчитывает. Оно, согласно ее планам, будет запущено к концу 2024 г. – об этом сообщил вице-президент IBM по гибридным облакам Мукеш Кхаре (Mukesh Khare).
Для тестового производства IBM задействовала мощности своей исследовательской лаборатории в городе Олбани (штат Нью-Йорк, США). Чипы были изготовлены на 300-миллиметровых пластинах.
IBM сравнила свой новый двухнанометровый чип с семинанометровыми. По ее заверениям, новинка обладает на 75% более высокой производительностью при том же уровне потребления энергии. При этом если снизить производительность до уровня 7 нм, то потребление энергии упадет на 45%.
Пластина с двухнанометровыми процессорами IBM
Engadget пишет, что серийные образцы чипов такие спецификации не получат – IBM постарается найти для них баланс производительности и энергопотребления, чтобы они превосходили 7 нм по обоим этим параметрам. Отметим, что по неизвестным причинам IBM не стала сравнивать свою разработку с процессорами, произведенными по пятинанометрвоым нормам. Такие впервые появились осенью 2020 г.
Скорость числовых операций
41.3 |
||
Минимум | Среднее | Максимум |
51 | Память: 70 | 80 |
Память |
||
28 | 1 ядро: 44 | 50 |
1 ядро |
||
42 | 2 ядра: 82 | 97 |
2 ядра |
||
10.1 |
||
Минимум | Среднее | Максимум |
48 | 4 ядра: 84 | 98 |
4 ядра |
||
55 | 8 ядер: 86 | 99 |
8 ядер |
1.5 |
||
Минимум | Среднее | Максимум |
53 | Все ядра: 86 | 100 |
Все ядра |
Для разных задач требуются разные сильные стороны CPU. Система с малым количеством быстрых ядер и низкими задержками памяти отлично подойдёт для подавляющего числа игр, но уступит системе с большим количеством медленных ядер в сценарии рендеринга.
Мы считаем, что для бюджетного игрового компьютера подходит минимум 4/4 (4 физических ядра и 4 потока) процессор. При этом часть игр может загружать его на 100%, подтормаживать и фризить, а выполнение любых задач в фоне приведёт к просадке ФПС.
В идеале экономный покупатель должен стремиться минимум к 4/8 и 6/6. Геймер с большим бюджетом может выбирать между 6/12, 8/8 и 8/16. Процессоры с 10 и 12 ядрами могут отлично себя показывать в играх при условии высокой частоты и быстрой памяти, но избыточны для подобных задач. Также покупка на перспективу — сомнительная затея, поскольку через несколько лет много медленных ядер могут не обеспечить достаточную игровую производительность.
Подбирая процессор для работы, изучите, сколько ядер используют ваши программы. Например, фото и видео редакторы могут использовать 1-2 ядра при работе с наложением фильтров, а рендеринг или конвертация в этих же редакторах уже использует все потоки.
Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне (максимальное значение в таблице), так и без (минимальное). Типичный результат указан посередине, чем больше заполнена цветная полоса, тем лучше средний результат среди всех протестированных систем.
Что такое тактовая частота
Количество операций, которое может выполнить центральный процессор за единицу времени, называется тактовой частотой. Если с одноядерным процессором все более-менее понятно, то многие неправильно понимают, как посчитать тактовую частоту процессора, где ядер несколько. Поэтому сегодня мы расскажем, что такое тактовая частота многоядерного процессора и как ее правильно посчитать.
Как вычисляется
Вычисляется тактовая частота процесора путем умножения частоты шины (ее еще называют базовой) на множитель. На примере процессора Intel i7 5600U с множителем 20 и базовой частотой шины 133МГц получаем частоту путем перемножения 133*20 итого 2,66 ГГц. Но не всегда предельная тактовая частота исчисляется так просто. Иногда возможности процессора позволяют ее разогнать: для этого нужно поднять либо множитель, либо базовую частоту. Множитель часто поднимают в тех устройствах, в которых он разблокирован (для чипов Intel – это серии, обозначенные индексом “U”, а для AMD – серия FX unlocked).
Частота многоядерного процессора
Но как определить общую производительность процессора, состоящего из нескольких ядер? Возьмем в пример 4-х ядерный процессор с тактовой частотой 3ГГц. Каждое ядро в нем будет работать именно с этой частотой, то есть, если все ядра будут выполнять какие-то вычислительные задачи, то можно сказать, что каждое ядро будет выполнять одинаковые вычисления в единицу времени. За загруженность ядер отвечает запущенное на компьютере приложение. Конечно, говорить о том, что 4-х ядерный процессор с указанной частотой равен по производительности одноядерному с тактовой частотой 12ГГЦ мы уже не будем. Это в корне неверно, ведь суть производительности процессоров с несколькими ядрами состоит в том, что процесс вычисления разбивается на несколько параллельных потоков, которые выполняются одновременно всеми (или несколькими) ядрами.
Приведем пример. Представим себе 4 абсолютно одинаковых ручья, ширина и глубина которых составляет один метр. Скорость течения воды в каждом отдельно взятом ручье будет равна трем метрам в секунду. Сколько кубометров воды за секунду протечет в этих ручьях вместе? Очевидно, что 12. Но скорость всех четырех ручьев мы по тому же принципу посчитать не можем. То же самое в компьютерах: мы не можем посчитать тактовую частоту (скорость воды в ручье), которая никак не умножается и не суммируется, когда увеличивается количество ядер.
Плюсы многоядерности
Преимущество многоядерных процессоров проявляется при работе с теми программами, которые разбивают процессы вычисления на параллельные потоки. В таких программах (зачастую это игры) производительность заметно возрастает по сравнению с одноядерными. А вот при работе со старыми приложениями вся производительность будет ограничена возможностями только лишь одного ядра. Точно также не следует сравнивать производительность 2-х ядерного процессора с частотой 3,5 ГГЦ и 4-х ядерного с частотой 2,7 ГГц (например). Скорость работы будет зависеть от конкретного приложения и от того как распределяется процесс на параллельные потоки. Если приложение может разбивать вычислительный процесс на несколько потоков, то эффективнее для него будет 4-х ядерный процессор. Если же нет – тогда 2-х ядерный, так как частота у него выше.
Тесты в играх
Измеренный нами FPS в популярных играх на Intel Core2 Duo E8200 и соответствие системным требованиям
Обратите внимание, что официальные требования разработчиков в играх не всегда совпадают с данными реальных тестов. Также на результат сильно влияет разгон системы и графические настройки в игре
Мы тестируем на высоких настройках в разрешении FullHD, чтобы получить цифры, близкие к реальному геймплею.
В среднем по всем игровым тестам, процессор набрал 40 баллов из 100, где за 100 принят самый быстрый игровой процессор на сегодняшний день.
Выберите игруAquanox Deep DescentAssassin»s Creed ValhallaBaldur»s Gate 3Call of Duty Black Ops Cold WarCall of Duty Black Ops Cold War BetaCall of Duty Modern Warfare 2 RemasteredChronos Before the AshesCloudpunkCrysis: RemasteredCyberpunk 2077Death StrandingDesperados IIIDestroy All Humans!DIRT 5DisintegrationF1 2020Gears TacticsGhostrunnerGhostrunner DemoGodfallHavenHorizon Zero DawnHyper ScapeImmortals Fenyx RisingIron HarvestIron Harvest DemoKingdoms of Amalur Re-ReckoningMafia Definitive EditionMafia II Definitive EditionMaid of SkerManeaterMarvel’s AvengersMarvel’s Avengers BetaMedieval DynastyMicrosoft Flight SimulatorMortal Shell BetaPredator: Hunting GroundsProject CARS 3Saints Row The Third RemasteredSerious Sam 4Star Citizen 3.10.2Star Wars: SquadronsSyberia The World Before — PrologueThe Dark Pictures Anthology: Little HopeTorchlight IIITotal War Saga TROYWasteland 3Watch Dogs LegionXCOM Chimera SquadYakuza Like a Dragon
Сравнить
Сферы использования
По заявлению IBM, двухнанометровые процессоры смогут ускорить вычисления в сфере искусственного интеллекта. Они также пригодятся в периферийных вычислениях и в ряде других областей. Сама IBM намерена использовать их в своих серверах Power Systems и мейнфреймах Z-серии.
IBM видит перспективы использования двухнанометровых чипов и в мобильных устройствах, например, в смартфонах. За счет пониженного потребления энергии новых процессоров мобильники, по ее подсчетам, нужно будет заряжать лишь раз в четыре дня.
Ноутбуки на двухнанометровых чипах получат прирост производительности (про их автономность IBM не упоминает), а автомобили с автопилотом благодаря им смогут быстрее обнаруживать и распознавать различные объекты на пути следования и реагировать на них.
Компания утверждает, что двухнанометровые чипы принесут пользу в освоении космоса, развитии квантовых вычислений и строительстве сотовых сетей пятого и шестого поколений. Также, по прогнозам главы IBM Research Дарио Гила (Dario Gil), их применение может положительно сказаться на снижении нагрузки на окружающую среду. Это может быть реализовано за счет перевода на них дата-центров, на которые сейчас приходится 1% мирового потребления электричества.
Intel Core и последователи
Неудача архитектуры NetBurst заставила Intel вновь обдумать стратегию на ближайшее будущее. Процессоры Pentium 4 показали, что NetBurst не может достойно конкурировать с AMD K8. Даже больше: с течением времени преимущество решений конкурента лишь возрастало. Поэтому в микроархитектуре следующего поколения, получившей имя Core и представленной в начале 2006 года, было решено вернуться к корням и позаимствовать лучшие черты архитектуры P6.
Список полученных изменений стоит начать с конвейера. Он получил «всего» 14 стадий — примерно столько же использовал конвейер P6, в отличие от 31-стадийного дизайна NetBurst. Процессор научился обрабатывать до четырех инструкций за такт. Архитектура Core изначально проектировалась под двухъядерность, поэтому для всех «голов» была предусмотрена общая кэш-память 2-го уровня. Такой подход обеспечивал большую скорость работы и меньшее энергопотребление. В Core была добавлена поддержка различных энергосберегающих технологий, суть которых заключалась во включении необходимой процессорной логики при необходимости. Положительно на производительности сказалась и улучшенная работа с подсистемой памяти. Помимо всего перечисленного, в Core был переработан алгоритм обработки 128-битных инструкций SSE, SSE2 и SSE3. Если раньше каждая команда обрабатывалась за два такта, то теперь для операции требовался лишь один такт.
Чем ответят конкуренты
На момент анонса IBM собственных двухнанометровых процессоров не было ни у одной другой компании в мире. Фабриками с необходимым для их производства оборудованием тоже пока никто, кроме IBM, не располагает.
Композитный ИИ: что это такое и зачем он нужен?
Искусственный интеллект
Самые передовые процессоры с точки зрения техпроцесса есть пока только у компаний Samsung, Qualcomm и Apple – все они в конце 2020 г. выпустили по собственному пятинанометровому чипу. У Samsung это Exynos 1080, у Qualcomm – Snapdragon 888, а Apple создала процессор М1
AMD лишь готовится к переходу на эти нормы, разрабатывая пока что семинанометровые Ryzen и Epyc, а Intel по-прежнему отдает предпочтение 14 нм и постепенно переходит на 10 нм. В марте 2021 г., как сообщал CNews, она обнародовала стратегию своего развития на ближайшие годы, в которой упомянут запуск семинанометрового производства в 2023 г.
Пятинанометровое производство освоили пока что две компании в мире – корейская Samsung и тайваньская TSMC. Последняя в настоящее время трудится над созданием двухнанометровых норм выпуска – над этим она работает с лета 2019 г.
В июле 2020 г. TSMC заявила о прорыве в разработке 2 нм и обозначила сроки перехода на этот техпроцесс – 2023-2024 гг. В марте 2021 г. Apple стала помогать TSMС – у нее есть прямой интерес в этом, поскольку все ее процессоры, включая пятинанометровый M1, выпускаются именно на заводах TSMC, и она рассчитывает стать основным заказчиком ее двухнанометровой продукции.
После включения Apple TSMC сместила крайний срок запуска двухнанометровой линии с 2024 г. на 2023 г. Попутно она ведет разработку трехнанометровых норм – выпуск соответствующих процессоров она намерена начать в 2022 г.
Тактовая частота многоядерных процессоров
Сегодня на рынке компьютерной индустрии уже практически не осталось так называемых «одноядерных» процессоров, и это вполне закономерно, ведь развитие прогресса не стоит на месте, требуя все более высоких скоростей и IT индустрия, вынуждена ему соответствовать. В связи с этим существует множество заблуждений относительно расчета тактовой частоты многоядерных процессоров.
Рассмотрим наиболее распространенный пример такого заблуждения:
Разберем ситуацию на другом примере. Представьте, что по дороге едет автомобиль с постоянной скоростью в 40 км/ч, будем считать это работой одноядерного процессора. А теперь представьте ту же дорогу, но уже с четырьмя едущими колонной с той же скоростью автомобилями. Кто возьмется утверждать, что суммарная скорость автомобилей равна 160 км/ч?
Конечно это очень утрированное сравнение, но общий смысл верен. Пользователь должен четко понимать, что от увеличения количества ядер процессора частота его работы не изменяется, а только увеличивается производительность компьютера в целом. И говоря о четырехядерном процессоре с тактовой частотой, к примеру, 3,2 ГГц, осознавать, что это не суммарная частота всех четырех ядер, а каждое ядро процессора работает с частотой 3,2 ГГц.
Ссылки[]
Официальная информация
- Описание архитектуры NetBurstШаблон:Ref-en
- Техническая документация по процессорам Pentium 4Шаблон:Ref-en
- Техническая документация по процессорам Pentium DШаблон:Ref-en
- Обзор технологии HyperThreading на сайте компании IntelШаблон:Ref-en
- Техническое описание технологии Hyper-threading на сайте IntelШаблон:Ref-en
- Обзор реализации HyperThreading на сайте MSDN компании MicrosoftШаблон:Ref-en
Характеристики процессоров архитектуры NetBurst
- Intel Pentium 4 processor familyШаблон:Ref-en
- Intel Pentium Extreme Edition microprocessor familyШаблон:Ref-en
- Intel Pentium D microprocessor familyШаблон:Ref-en
- Intel Desktop Celeron Willamette processorШаблон:Ref-en
- Intel Desktop Celeron Northwood processorШаблон:Ref-en
- Intel Celeron D processor familyШаблон:Ref-en
Обзоры процессоров и описания архитектуры
- Pentium 4: от Willamette до Prescott. Часть 1
- Pentium 4: от Willamette до Prescott. Часть 2
- Pentium 4: от Willamette до Prescott. Часть 3
- Pentium 4: от Willamette до Prescott. Часть 4
- Pentium 4: Мистический и загадочный Trace-кэш
- Intel Prescott: в погоне за частотой
- Развитие технологии SSE в новых процессорах Intel Prescott
- Обзор процессора Pentium 4 3.06 с технологией Hyper-Threading
Шаблон:Хорошая статья
Преимущества
Причины выбрать Intel Core 2 Duo E8600
- Процессор новее, разница в датах выпуска 7 month(s)
- Примерно на 25% больше тактовая частота: 3.33 GHz vs 2.67 GHz
- Производительность в бенчмарке PassMark — Single thread mark примерно на 27% больше: 1402 vs 1108
- Производительность в бенчмарке PassMark — CPU mark примерно на 34% больше: 1337 vs 999
- Производительность в бенчмарке Geekbench 4 — Single Core примерно на 27% больше: 468 vs 368
- Производительность в бенчмарке Geekbench 4 — Multi-Core примерно на 30% больше: 798 vs 612
- Производительность в бенчмарке CompuBench 1.5 Desktop — Face Detection (mPixels/s) примерно на 14% больше: 0.368 vs 0.322
- Производительность в бенчмарке CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) примерно на 2% больше: 27.856 vs 27.206
- Производительность в бенчмарке CompuBench 1.5 Desktop — T-Rex (Frames/s) примерно на 9% больше: 0.109 vs 0.1
- Производительность в бенчмарке CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) примерно на 8% больше: 2.67 vs 2.463
- Производительность в бенчмарке CompuBench 1.5 Desktop — Video Composition (Frames/s) примерно на 2% больше: 0.7 vs 0.685
Характеристики | |
Дата выпуска | August 2008 vs January 2008 |
Максимальная частота | 3.33 GHz vs 2.67 GHz |
Бенчмарки | |
PassMark — Single thread mark | 1402 vs 1108 |
PassMark — CPU mark | 1337 vs 999 |
Geekbench 4 — Single Core | 468 vs 368 |
Geekbench 4 — Multi-Core | 798 vs 612 |
CompuBench 1.5 Desktop — Face Detection (mPixels/s) | 0.368 vs 0.322 |
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) | 27.856 vs 27.206 |
CompuBench 1.5 Desktop — T-Rex (Frames/s) | 0.109 vs 0.1 |
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) | 2.67 vs 2.463 |
CompuBench 1.5 Desktop — Video Composition (Frames/s) | 0.7 vs 0.685 |
Процессоры архитектуры NetBurst[]
Процессор | Ядро | Технология производства | Годы выпуска |
---|---|---|---|
Pentium 4 | Willamette, Northwood, Gallatin, Prescott, Cedar Mill | КМОП, 180—65 нм | 2000—2007 |
Pentium D | Smithfield, Presler | КМОП, 90—65 нм | 2005—2007 |
Celeron | Willamette-128, Northwood-128 | КМОП, 180—130 нм | 2001—2005 |
Celeron D | Prescott-256, Cedar Mill-512 | КМОП, 90—65 нм | 2004—2007 |
Xeon | Foster, Prestonia, Gallatin, Potomac, Cranford, Irwindale, Nocona, Paxville, Dempsey, Tulsa | КМОП, 180—65 нм | 2001—2007 |
Pentium 4 (Northwood) | Pentium D (Smithfield) | Celeron (Northwood-128) | Celeron D (Prescott-256) | Xeon DP (Foster) |
---|---|---|---|---|
Pentium 4 (Northwood) | Pentium D (Smithfield) | Celeron (Northwood-128) | Celeron D (Prescott-256) | Xeon DP (Foster) |
Сравнение бенчмарков
CPU 1: Intel Core 2 Duo E8600CPU 2: Intel Core 2 Duo E6750
PassMark — Single thread mark |
|
|
||||
PassMark — CPU mark |
|
|
||||
Geekbench 4 — Single Core |
|
|
||||
Geekbench 4 — Multi-Core |
|
|
||||
CompuBench 1.5 Desktop — Face Detection (mPixels/s) |
|
|
||||
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) |
|
|
||||
CompuBench 1.5 Desktop — T-Rex (Frames/s) |
|
|
||||
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) |
|
|
||||
CompuBench 1.5 Desktop — Video Composition (Frames/s) |
|
|
Название | Intel Core 2 Duo E8600 | Intel Core 2 Duo E6750 |
---|---|---|
PassMark — Single thread mark | 1402 | 1048 |
PassMark — CPU mark | 1337 | 989 |
Geekbench 4 — Single Core | 468 | 358 |
Geekbench 4 — Multi-Core | 798 | 628 |
CompuBench 1.5 Desktop — Face Detection (mPixels/s) | 0.368 | 0.193 |
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) | 27.856 | 21.122 |
CompuBench 1.5 Desktop — T-Rex (Frames/s) | 0.109 | 0.068 |
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) | 2.67 | 2.133 |
CompuBench 1.5 Desktop — Video Composition (Frames/s) | 0.7 | 0.419 |
AMD K7
Дебют архитектуры AMD K7 и процессоров Athlon пришелся на август 1999 года. Американская компания ставила перед собой всё более и более серьезные задачи, поэтому ожидания пользователей от новой разработки были довольно высоки, особенно учитывая просачивающуюся в прессу информацию о технических характеристиках.
Еще задолго до того, как компания выпустила платформу K7, AMD и Motorola заключили партнерское соглашение, в рамках которого для производства новых процессоров могли использоваться фабрики Motorola. Результатом их сотрудничества стала технология производства кристаллов с применением медных соединений.
Преимущества
Причины выбрать Intel Core 2 Duo E8200
- Процессор новее, разница в датах выпуска 6 month(s)
- Примерно на 15% больше тактовая частота: 2.67 GHz vs 2.33 GHz
- Примерно на 1% больше максимальная температура ядра: 72.4°C vs 72°C
- Более новый технологический процесс производства процессора позволяет его сделать более мощным, но с меньшим энергопотреблением: 45 nm vs 65 nm
- Кэш L1 в 2 раз(а) больше, значит больше данных можно в нём сохранить для быстрого доступа
- Кэш L2 примерно на 50% больше, значит больше данных можно в нём сохранить для быстрого доступа
- Производительность в бенчмарке PassMark — Single thread mark примерно на 21% больше: 1108 vs 916
- Производительность в бенчмарке PassMark — CPU mark примерно на 14% больше: 999 vs 873
- Производительность в бенчмарке Geekbench 4 — Single Core примерно на 21% больше: 368 vs 303
- Производительность в бенчмарке Geekbench 4 — Multi-Core примерно на 16% больше: 612 vs 527
- Производительность в бенчмарке CompuBench 1.5 Desktop — Face Detection (mPixels/s) примерно на 23% больше: 0.322 vs 0.261
- Производительность в бенчмарке CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) примерно на 46% больше: 27.206 vs 18.666
- Производительность в бенчмарке CompuBench 1.5 Desktop — T-Rex (Frames/s) примерно на 30% больше: 0.1 vs 0.077
- Производительность в бенчмарке CompuBench 1.5 Desktop — Video Composition (Frames/s) примерно на 85% больше: 0.685 vs 0.371
- Производительность в бенчмарке CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) примерно на 31% больше: 2.463 vs 1.88
Характеристики | |
Дата выпуска | January 2008 vs July 2007 |
Максимальная частота | 2.67 GHz vs 2.33 GHz |
Максимальная температура ядра | 72.4°C vs 72°C |
Технологический процесс | 45 nm vs 65 nm |
Кэш 1-го уровня | 128 KB vs 64 KB |
Кэш 2-го уровня | 6144 KB vs 4096 KB |
Бенчмарки | |
PassMark — Single thread mark | 1108 vs 916 |
PassMark — CPU mark | 999 vs 873 |
Geekbench 4 — Single Core | 368 vs 303 |
Geekbench 4 — Multi-Core | 612 vs 527 |
CompuBench 1.5 Desktop — Face Detection (mPixels/s) | 0.322 vs 0.261 |
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) | 27.206 vs 18.666 |
CompuBench 1.5 Desktop — T-Rex (Frames/s) | 0.1 vs 0.077 |
CompuBench 1.5 Desktop — Video Composition (Frames/s) | 0.685 vs 0.371 |
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) | 2.463 vs 1.88 |
AMD K8
В конце 2003 года AMD выпустила новую архитектуру K8. На этот раз архитектурных изменений было не так много.
Ключевых нововведений было три: это 64-битная архитектура, встроенный контроллер памяти и шина HyperTransport. Новые продукты AMD получили название Athlon 64.
Действительно, именно в кристаллах K8 архитектура x86 впервые получила расширение и стала 64-битной. Само расширение официально именуется x86-64, но AMD назвала его по-своему — AMD64. Была получена и обратная совместимость с 16- и 32-разрядными приложениями, то есть 64-битные процессоры AMD без проблем работали со старыми программами.
Описание работы[]
Конвейер состоит из 20 стадий:
- TC, NI (1, 2) — поиск микроопераций, на которые указывает последняя выполненная инструкция.
- TR, F (3, 4) — выборка микроопераций.
- D (5) — перемещение микроопераций.
- AR (6 — — резервирование ресурсов процессора, переименование регистров.
- Q (9) — постановка микроопераций в очереди.
- S (10 — 12) — изменение порядка исполнения.
- D (13 — 14) — подготовка к исполнению, выборка операндов.
- R (15 — 16) — чтение операндов из регистрового файла.
- E (17) — исполнение.
- F (18) — вычисление флагов.
- BC, D (19, 20) — проверка корректности результата.
Выполнение инструкции начинается с её выборки и декодирования. В том случае, если соответствующая ей последовательность микроопераций отсутствует в кэше последовательностей микроопераций, инструкция считывается из кэш-памяти второго уровня и декодируется. Так как инструкции, хранящиеся в кэш-памяти, имеют физические адреса, для осуществления выборки блоком трансляции адресов производится преобразование виртуального адреса в физический.
Микрооперации, полученные в результате декодирования, помещаются в кэш последовательностей микроопераций. В том случае, если встречается инструкция условного перехода, последовательность микроопераций формируется на основании предсказания перехода, осуществляемого соответствующим блоком. Если инструкция не может быть преобразована в последовательность длиной до четырёх микроопераций, она заменяется на подпрограмму, хранящуюся в ПЗУ микрокода и формирующую такие последовательности. При этом в кэше последовательностей хранятся не сами микрооперации, а адрес этой подпрограммы. Микрооперации, хранящиеся в кэше последовательностей, помещаются в очередь микроопераций.
После подготовки процессора к выполнению микроопераций (резервирование ресурсов, переименование регистров), они помещаются в соответствующие их типам очереди: микрооперации, осуществляющие взаимодействие с памятью, помещаются в отдельную очередь длиной 16 микроопераций, а все остальные — в общую очередь (32 микрооперации). После определения порядка выполнения микроопераций (порядок может быть изменён в зависимости от готовности данных для выполнения микроопераций, от наличия переисполняемых инструкций, наличия свободных вычислительных ресурсов и т. п.), планировщики отправляют микрооперации на выполнение в соответствующие исполнительные блоки: микрооперации, взаимодействующие с памятью, отправляются в блоки генерации адреса, целочисленные операции — в блоки АЛУ, а вещественночисленные — в блоки обработки чисел с плавающей запятой. При этом операнды, необходимые для выполнения микроопераций либо считываются из регистрового файла, либо передаются как результат выполнения предыдущей микрооперации. После выполнения микроопераций происходит формирование флагов и проверка корректности результатов. В том случае, если результаты корректны, происходит отставка (Шаблон:Lang-en) микроопераций, а результаты помещаются в регистровый файл. Если же результаты выполнения микрооперации некорректны (например, был неверно предсказан переход, или необходимые данные не были вовремя получены), эта микрооперация отправляется на повторное исполнение.
История[]
Архитектура NetBurst пришла на смену архитектуре P6 на рынке процессоров для настольных и серверных систем. Она не являлась развитием архитектуры P6, а представляла собой принципиально новую по сравнению со всеми предшественниками архитектуру.
Первые процессоры архитектуры NetBurst были анонсированы 20 ноября 2000 года.
8 августа 2007 года компания Intel объявила о начале действия программы по снятию с производства всех процессоров этой архитектуры. На смену процессорам архитектуры NetBurst пришли процессоры семейства Core 2 Duo, архитектура которых представляет собой развитие архитектуры P6.
Тактовая частота: что это такое и как она влияет на скорость работы компьютера
Для синхронизации и согласования работы различных устройств, имеющих разное быстродействие, используется тактовая частота. Любая команда выполняется за один или несколько циклов (тактов), а скорость чередования импульсов (частота) задает ритм работы всех составляющих системы и во многом определяет скорость работы. Источником тактовой частоты является отдельный блок – генератор, который представляет собой кварцевый резонатор. Чем больше импульсов за одну секунду подает генератор, тем быстрее происходят вычислительные операции, тем быстрее работает компьютер. Именно так до недавнего времени и было, но с изобретением многоядерных процессоров ситуация несколько изменилась. Итак, тактовая частота – это количество импульсов в секунду, которые синхронизируют работу компьютера.
Сегодня на производительность работы компьютера оказывает влияние не только тактовая частота, а и объем кэша, количество ядер, скорость работы видеокарты и архитектура процессора. Например, современные многоядерные процессоры имеют относительно невысокую тактовую частоту, а работают намного быстрее. Это достигается путем программного разделения вычислительных операций между ядрами процессора. Таким образом, операция при меньшей скорости обработки выполняется быстрее – увеличивается быстродействие компьютера. После появления многоядерных процессоров повышение тактовой частоты стало не столь актуальным. Сегодня скорость работы компьютера, наряду с этим параметром, определяется и количеством ядер, и скоростью реакции/обработки данных в других частях системы.
В процессе изготовления процессоры тестируются в различных режимах, при различных температурах и давлении. В результате тестов определяется максимальная рабочая тактовая частота, которая и стоит на маркировке. Но это не самое большое ее значение, существует такое понятие, как разгон процессора, при котором тактовая частота намного возрастает.
Производство многоядерных процессоров решило еще одну проблему: уменьшение температуры процессора. С увеличением тактовой частоты повышалось выделение тепла процессором, что вело к перегреву и сбоям в работе. Многоядерные процессоры позволили при невысоких частотах увеличить быстродействие. Многие современные модели при неполной загрузке могут временно понижать тактовую частоту, сокращая энергопотребление и выделение тепла. За это время процессор успевает остывать, что ведет к снижению оборотов вентиляторов, уменьшению потребления электроэнергии и понижению шумов (на высоких оборотах вентиляторы «звучат» достаточно громко).
Для игровых компьютеров не меньшую роль играет тактовая частота видеокарты. Тут имеется прямая зависимость – чем выше этот параметр, тем быстрее идет прорисовка готовых пикселей и выборка текстурных данных. Но устанавливать высокоскоростную видеокарту и иметь низкоскоростной процессор и ОЗУ небольшого объема не имеет смысла. Параметры всех этих устройств должны быть сбалансированы. Только в этом случае компьютер будет работать с высокой скоростью и без сбоев.
Заключение
Вот и подошел к концу наш рассказ об истории развития центральных процессоров. Оглядываясь назад, можно увидеть, насколько современные «камни» отличаются хотя бы от тех решений, которые выпускались 15-20 лет назад. И удивительно, как при этом они могут иметь даже общие черты. Например, ту же архитектуру x86. А что касается ближайшего будущего, то нас непременно ждет много всего интересного. На конец этого года запланировал релиз 14-нм архитектуры Intel Broadwell, а на вторую половину 2015 года — новой платформы Skylake. В стане AMD готовятся к выходу в следующем году последнего поколения архитектуры Bulldozer под названием Excavator, после которой планируется запуск совершенно новых кристаллов. Очевидно, что Intel и AMD не дадут нам заскучать.