Đề Tài TÌM HIỂU KIẾN TRÚC VI XỬ LÝ INTEL PENTIUM 4 VI KIẾN TRÚC NETBURST Giáo Viên Hướng Dẫn NGUYỄN VIỆT HÙNG môn kỹ thuật vi xử lý

43 848 1
Đề Tài  TÌM HIỂU KIẾN TRÚC VI XỬ LÝ INTEL PENTIUM 4 VI KIẾN TRÚC NETBURST Giáo Viên Hướng Dẫn  NGUYỄN VIỆT HÙNG môn kỹ thuật vi xử lý

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC KHOA HỌC HUẾ KỸ THUẬT VI XỬ LÝ Đề Tài : TÌM HIỂU KIẾN TRÚC VI XỬ LÝ INTEL PENTIUM VI KIẾN TRÚC NETBURST Giáo Viên Hướng Dẫn : NGUYỄN VIỆT HÙNG NHĨM 2: Trần Thị Hồng Nhung Trương Thành Huy Đặng Hoàng Nhật Anh Nguyễn Thanh Hòa Phan Minh Triết Hồ Thanh Hiếu MỤC LỤC I GIỚI THIỆU :.……………………………………… ……………………… Giới thiệu chung …… ………….…………………………………………… 1.1 Vi xử lý ……………………………………………………… 1.2 Các thành phần ……………………………………………….4 ? Các công nghệ Intel ……………………………………………………5 2.1 Hyper-Pipelined Technology - Công nghệ Siêu ống ………… .5 2.2 Execution Trace Cache ………………………………………… 2.3 Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng .5 2.4 Advanced Transfer Cache (ATC) …………………………… 2.5 Out-Of-Order Execution ……………………………………….…6 2.6 Branch Prediction (phỏng đoán nhánh) …………………….…… 2.7 Rapid Execution Engine …………………………………….…….6 2.8 Quad Data Rate ………………………………………… ……… 2.9 Enhanced Floating Point & Multimedia Unit ………………… …7 2.10 Streaming SIMD Extension (SSE2) Instructions ……….…….…7 2.11 Hyper Threading (siêu phân luồng) …………………………….…8 Giới thiệu vi xử lý Intel Pentium ……………………………………….….8 II KIẾN TRÚC NETBURST ……………………………………………………11 Sơ đồ khối vi kiến trúc NETBURST ………………………………………11 III KIẾN TRÚC CỦA VI XỬ LÝ INTEL PENTIUM …………… ………… 13 Sơ đồ khối vi xử lý Intel Pentium ……………………………… …………13 Hyper Pipeline ……………………………………………………… ………14 Front End …………………………………………………………… ………16 3.1 Trace cache.……………………………………………… …….16 3.2 Microcode ROM ………………………… …………………….17 3.3 ITLB and Front-End BTB ……………………………………… 18 3.4 IA-32 Intruction Decoder …………………… …………………18 Out-of-oder Excution Logic ………………………………… ………………19 4.1 Allocator Register Renamer ………………… …………… 19 4.2 Scheduler Funtions ……………………………… …………… 20 Integer and Floating-Point Execution Units …………………… …………….21 5.1 Execution Unit ……………………………………… …………21 5.2 L1 Cache ……………………………………………… ……….23 Memory Subsystem ………………………………………………… ………23 6.1 Advanced Transfer Cache ……………………………………… 23 6.2 Bus hệ thống ………………………………………………… …24 IV TẬP ………………………………………………………………………24 LỆNH General-purpose instructions ………………………………………………….25 Nhóm lệnh ……………………………………………………………27 hệ thống X87 FPU (Floating Point Unit) instructions ………………………… …… 27 X87 FPU and SIMD state management instructions…………………… ……28 CÔNG NGHỆ MMX …………………………………………………… … 29 SSE ……………………………………………………………… 30 Streaming SIMD Instructions…………………………… 31 Extension SE3 33 Instructions (SSE2) Instructions 64-bit mode instructions …………………………………………………… 35 V LUẬN………… 36 KẾT I GIỚI THIỆU: Giới thiệu chung 1.1, Vi xử lý gì? Vi xử lý chip bán dẫn kết hợp chức đơn vị xử lý trung tâm (CPU) một vài mạch tích hợp Nó thiết bị đa chức năng, lập trình được, nhận tín hiệu số đầu vào, xử lý theo lệnh lưu nhớ, cung cấp kết đầu Vi xử lý trái tim máy tính thơng thường Bất kể máy bàn, laptop hay server, vi xử lý bạn sử dụng loại chúng gần giống làm việc theo cách gần Một vi xử lý thi hành loạt lệnh máy báo cho đơn vị xử lý biết phải làm Dựa lệnh, vi xử lý làm việc sau: - Sử dụng ALU, vi xử lý làm phép toán cộng, trừ, nhân, chia Các vi xử lý đại bao gồm xử lý dấu phảy động với phép toán yêu cầu độ xác cao - Một vi xử lý chuyển liệu từ vị trí nhớ tới vị trí khác - Một vi xử lý tạo định nhảy tới tập lệnh 1.2, Các thành phần bản: Các thành phần vi xử lý nói chung : - Một bus địa gửi địa tới nhớ - Một bus liệu gửi nhận liệu từ nhớ - Một đường RD(đọc) WR(ghi) để vi xử lý thông báo cho cho nhớ biết gần đặt hay lấy giá trị vùng đánh dấu địa - Một đường clock cho xung clock xử lý - Một đường reset đếm chương trình bắt đầu thực lệnh - Thanh ghi A,B,C chốt đơn giản tạo từ mạch lật - Chốt địa chỉ(address latch) giống ghi A,B,C Hình 1.2.1-a : Các thành phần vi xử lý - Bộ đếm chương trình mạch lật với khả tăng thêm trở yêu cầu - ALU coi đơn giản cộng bit, cộng, trừ, nhân, chia - Thanh ghi thử chốt đặc biệt để giữ giá trị từ phép so sánh ALU Một ALU so sánh hai số định xem chúng nhau, nhỏ hay lớn số lại Thanh ghi để lưu bit từ trạng thái cộng trước - 3-state sơ đồ tren đệm tri-state(3 trạng thái) cho phép nhiều đầu kết nối với dây dẫn có số chúng vào dòng - Thanh ghi lệnh giải mã lệnh chịu trách nhiệm việc điều khiển tất thành phần khác Các công nghệ Intel Khả cung cấp số cơng nghệ tính tăng cường dựa vào tiến Intel lĩnh vực thiết kế mạch, quản lý việc tiêu thụ lượng tính tốn khơng thể thực mơ hình vi kiến trúc hệ CPU trước 2.1 Hyper-Pipelined Technology - Công nghệ Siêu ống Là công nghệ giới thiệu Vi kiến trúc Netburst™ Intel Nó tang gấp đơi "độ sâu" "ống" xử lý lệnh CPU so sánh với mơ hình Vi kiến trúc P6 sử dụng hệ CPU Pentium III Lệnh thực 20 giai đoạn (20 stages) vi kiến trúc Netburst, so với 10 giai đoạn vi kiến trúc P6 Ống lệnh dài giúp chip Pentium đạt mức xung nhịp cao 2.2 Execution Trace Cache Là nhớ đệm cấp (Level Execution Trace Cache) Bên cạnh 8KB nhớ đệm dùng để chứa liệu (data cache), Pentium có khả lưu trữ đến 12K vi lệnh giải mã (decoded micro-ops) nhằm giúp tăng cường tốc độ thực thi lệnh CPU 2.3 Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng Thực dựa hai Đơn vị Luận lý Số học (Arithmetic Logical Unit - ALU) thiết kế bên Pentium Nó cho phép Pentium thực lệnh số học (cộng, trừ, nhân chia) luận lý (Và-And, Hoặc-Or ) với tốc độ gấp lần tần số xử lý xử lý Như CPU Pentium - 2.0Ghz (bus 400Mhz) có khả thực lệnh với tốc độ 4.0Ghz CPU Pentium - 2.53Ghz (bus 533Mhz) thực với tốc độ 5.1Ghz 2.4 Advanced Transfer Cache (ATC) Là nhớ đệm cấp (L2 Cache) thiết kế bên Pentium ATC có hai loại: 512 KB L2 ATC với tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz 2.40(B)Ghz - 2.26Ghz - 2.20Ghz - 2.0(A)Ghz 1.6(A)Ghz; 256 KB L2 ATC với tốc độ từ 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thơng lượng cao (high data throughput channel) với nhân CPU (CPU core) ATC bao gồm giao diện 256-bit (32 byte) để truyền liệu xung clock Điều cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp lần tốc độ truyền liệu L2 Cache sử dụng CPU Pentium III Ví dụ: CPU Pentium - 2.53Ghz có tốc độ truyền liệu lên tới 81GB/giây, so với tốc độ truyền liệu 16GB/giây Pentium III - 1.0 Ghz 2.5 Out-Of-Order Execution Nhân hỗ trợ Out-of-Order Execution xếp lại vi lệnh, cho phép lệnh (cùng với đầu vào tài nguyên hệ thống cần thiết) để thực thi tránh lãng phí thời gian Khi vi lệnh chờ cấp phát tài nguyên liệu, lệnh khác (thường buffer) chen vào thực thi Nhờ thực thi lệnh song song, khoảng trễ pipeline bị loại bỏ Nhân thực thi nhiều lệnh mỗ giai đoạn pipeline Sau in-order retirement unit tìm lệnh xong khơng cịn phụ thuộc liệu liên quan đến lệnh rẽ nhánh chưa hoàn thất để xử lý lưu kết nhớ theo trật tự ban đầu 2.6 Branch Prediction (phỏng đốn nhánh) Kiến trúc NetBurst nhớ nhánh chương trình chạy, giúp làm giảm độ trễ trình nhảy nạp đầy ống lệnh, Các nhánh lưu giữ sở địa lệnh bên Branch Target Buffer (BTB) Bộ vi xử lý dự đoán nhánh tới trước lệnh rẽ nhánh thực 2.7 Rapid Execution Engine Trong Pentium 4, có ALU (Arithmetic Logic Unit) hai AGU (Address Generation Unit) chạy với mức xung gấp đôi xung clock Rapid execution engine giới thiệu làm giảm độ trễ việc thực phép toán đơn giản Điều thực có ý nghĩa hiệu tốc độ vi xử lý phụ thuộc nhiều vào tính tốn số ngun ALU 2.8 Quad Data Rate FSB Pentium truyền bốn lần liệu xung clock Cơng nghệ Quad Pumped hay cịn gọi Quad Data Rate (QDR) QDR khiến cho xung nhịp hiệu dụng tăng lên gấp lần so với xung thực Nhờ CPU Pentium đạt đến 400Mhz System bus, tốc độ truyền nhận liệu vào-ra CPU 3.2GBps so với tốc độ tương ứng 1.06GBps Pentium III (133Mhz system bus) Real Clock 100 MHz 133 MHz 200 MHz 266 MHz 2.9 Performance 400 MHz 533 MHz 800 MHz 1,066 MHz Transfer Rate 3.2 GB/s 4.2 GB/s 6.4 GB/s 8.5 GB/s Enhanced Floating Point & Multimedia Unit Bộ xử lý Pentium mở rộng ghi dấu chấm động (floating-point register) lên tới 128-bit tạo thêm ghi mở rộng nhằm phục vụ việc di chuyển liệu Do vậy, khả xử lý ứng dụng dấu chấm động (tính tốn kết cấu, số liệu tài chính, số liệu khoa học…) truyền thông đa phương tiện (dựng xử lý phim video, xử lý hình ảnh đồ họa…) tăng cường nhiều 2.10 Streaming SIMD Extension (SSE2) Instructions Là tập lệnh hỗ trợ đồ họa mở rộng thiết kế cho Pentium Vi kiến trúc Netburst™ (Netburst™ Microarchitecture) mở rộng khả xử lý theo kiểu cấu trúc SIMD cơng nghệ Intel® MMX™ SSE cách thêm vào 144 lệnh Các lệnh bao gồm tác vụ số nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) tác vụ dấu chấm động (128-bit SIMD double-precision floating-point operations) Các lệnh làm tối ưu hóa khả thực hịên ứng dụng phim video, xử lý âm - hình ảnh, mã hóa, tính tốn khoa học 2.11 Hyper Threading (siêu phân luồng) Hyper threading công nghệ cho phép CPU vật lý hoạt động hệ điều hành hai CPU logic hoạt động song song Nó dựa nguyên tắc vào thời điểm có phần tài nguyên CPU sử dụng để thực thi lệnh tiến trình, phần chưa sử dụng dùng để thực thi tiến trình khác Trong CPU sử dụng công nghệ Hyper-Threading, CPU logic sở hữu tập ghi, kể ghi đếm chương trình PC riêng (separate program counter), CPU vật lý luân phiên giai đoạn tìm/giải mã hai CPU logic cố gắng thực thi thao tác từ hai chuỗi lệnh đồng thời theo cách hướng tới đơn vị thực thi sử dụng Giới thiệu vi xử lý Intel Pentium Pentium vi xử lý đơn nhân kiến trúc x86 hệ thứ Intel sản xuất, thiết kế CPU hoàn toàn họ kể từ Pentium III năm 1995 Thiết kế gọi kiến trúc NetBurst Không Pentium II, Pentium III Celeron, kiến trúc tạo hoàn toàn thừa kế từ thiết kế Pentium Pro/P6 Một số công nghệ bật áp dụng kiến trúc NetBurst Hyper Pipelined Technology(Công nghệ siêu ống) mở rộng số hàng lệnh xử lý, làm hiệu suất Bảng sau tóm tắt lệnh thơng dụng nhóm này: Tên Đối số Phép tốn Mơ tả Nhóm lệnh mov SRC,DST DST=SRC xchg SRC,DST Truyền liệu PUSH SRC pop DST xor or and cmp test inc dec add sub mul SRC,DST SRC,DST SRC,DST A,B A,B DST DST SCR,DST SCR, DST SRC imu SRC div SRC idiv SRC DST=SRC SRC= DST (%esp) = SRC; %esp -=4; DST = (%esp); %esp +=4; DST =DST ^ SRC DST =DST | SRC DST = DST $ SRC EFLAGS = B - A EFLAGS = B +A DST ++ DST DST =DST+ SRC DST = DST –SRC %edx :%eax = %eax * SRC %edx :%eax = %eax * SRC %edx = %eax MOD SRC %edx = %eax / SRC %edx = %eax MOD SRC %edx = %eax / SRC Sao chép nguồn vào đich Hoán chuyển jmp LABEL je jne LABEL LABEL jg LABEL jge LABEL Đẩy vào Stack Lấy khỏi Stack Bitwise xor Bitwise or Bitwise and So sánh Và Tăng Giảm Cộng Trừ Nhân (khơng dấu) Nhân (có dấu) 28 Số học Chia (khơng dấu) Chia (có dấu) Nhảy vơ điều kiện Nhảy Nhảy không Nhảy lớn Nhảy lớn Nhảy nhỏ jl Luận lý Các lệnh nhảy Nhảy nhỏ jle call loop loope loopz loopnz int LABEL LABEL LABEL LABEL LABEL INT_NR Vòng lặp khác Gây ngắt số hiệu INT_NR NHÓM LỆNH HỆ THỐNG (system instruction) Các lệnh dùng để hỗ trợ hệ điều hành việc điều khiển chức VXL Một số lệnh thường gặp: Lệnh Chức LGDT/ SGDT Nạp/lưu ghi bảng mơ tả tồn cục (GDT register) LTR/STR Nạp/nhớ ghi tác vụ LLDT/SLDT Nạp/lưu ghi bảng mô tả cục bộ(LDT register) LAR Nạp quyền truy cập LIDT/SIDT Nạp/lưu ghi bảng mô tả ngắt (IDT register) LMSW/SMSW Nạp/lưu trạng thái VERR/VERW Xác nhận đoạn để đọc/ghi INVD/WBINVD Vơ hiệu hóa cache, khơng ghi/ghi trở lại XSAVE Lưu cờ mở rộng vào nhớ XGETBV/ XSETBV Đọc/ghi trạng thái ghi điều khiển mở rộng LOCK(prefix) Khóa bus RDPMC Đọc đếm giám sát hiệu XRSTOR Khôi phục cờ mở rộng từ nhớ ARPL Điều chỉnh quyền ưu tiên X87 FPU (Floating Point Unit) instructions 29 - Các lệnh sử dụng đơn vị tính tốn dấu chấm động Tuy khơng thuộc nhóm lệnh nhóm quan trọng có tất vi xử lý x86 đại Nhóm lệnh hỗ trợ tính tốn số ngun, số thực dấu chấm động, xử lý thập phân/nhị phân … Đó sở cho tính tốn đồ họa khoa học phức tạp hệ thống bên  x87 FPU Data Transfer Instructions (tập lệnh di chuyển liệu) FLD/FST: tải/lưu giá trị dấu phẩy động FILD/FIST:tải/lưu số nguyên FCMOVE/FCMOVNE:di chuyển số dẩu phảy động vs điều kiện nhau/không nhau,v v…  x87 FPU Basic ArithmetiC Instructions(tập lệnh số học bản) Thực thi toán hạng số nguyên số thực dấu chấm động; FADD/ FSUB: cộng/trừ toán hạng số thực dấu chấm động FISUB: trừ số nguyên FMUL/FIMUL: nhân toán hạng số thực dấu chấm động/số nguyên v…v  x87 FPU Comparison Instructions (các lệnh so sánh) Kiểm tra so sánh toán hạng số nguyên/số thực chấm động: FCOM/FXAM: so sánh/kiểm tra toán hạng dấu phảy động, FTST kiểm tra toán hạng dấu phảy động (so sánh với 0.0) FICOMP : so sánh số nguyên FCOMI : so sánh số thực dấu chấm động đặt EFLAGS (Compare floatingpoint and set EFLAGS) …v…v  x87 FPU Transcendental Instructions (các lệnh siêu việt) Thực thi phép tính lượng giác logarit toán hạng dấu phảy động  x87 FPU Load Constants Instructions (các lệnh tải số) Các lệnh tải số phổ biến vào ghi x87 floating-point FLDZ Load +0.0, FLDPI Load π, FLDLG2 Load log10,FLDL2E Load log2e, FLDLN2 Load loge, FLDL2T Load log210  x87 FPU Control Instructions (các lệnh điều khiển) 30 FINCSTP/ FDECSTP: Increment/ Decrement FPU register stack pointer FFREE : giải phóng ghi chứa số thực dấu chấm động FSTENV: lưu trữ môi trường FPU sau kiểm tra điều kiện lỗi FRSTOR : khôi phục vùng FPU X87 FPU and SIMD state management instructions Được giới thiệu từ dòng VXL Pentium II, SIMD (Single Instruction, Multiple Data: lệnh đơn,nhiều liệu) cho phép lệnh xử lý số mục liệu đồng thời Các tập lệnh MMX, SSE xây dựng xoay quanh khái niệm FXSAVE : lưu x87 FPU SIMD FXRSTOR : khôi phục x87 FPU SIMD Ban đầu,các lệnh thực thi ghi x87 FPU(và MMX) để lưu khơi phục cách nhanh chóng, với giới thiệu SSE ( phần mở rộng Pentium III, lệnh mở rộng để lưu khôi phục ghi XMM MXCRS CÔNG NGHỆ MMX Tập lệnh gồm 57 lệnh multimedia Intel phát triển năm 1997 Mục đích MMX nâng cao hiệu xử lý lệnh lặp âm thanh, hình ảnh đồ họa Máy đạt điều phần dòng lệnh đơn xử lý đồng thời số mục liệu Các lệnh MMX thực gói byte, word, doubleword, quadword chứa nhớ, ghi MMX, ghi chung Các lệnh MMX thực VXL hỗ trợ công nghệ MMX Các lệnh MMX chia thành nhóm sau : a MMX Data Transfer Instructions (các lệnh di chuyển liệu) Các lệnh di chuyển toán tử doubleword quadword ghi MMX, ghi MMX nhớ  MOVD : di chuyển doubleword  MOVQ : di chuyển quadword b MMX Conversion Instructions (các lệnh chuyển đổi ) 31 Chuyển qua lại bytes, words, and doublewords c MMX Packed Arithmetic Instructions (các lệnh số học) Các lệnh thực việc đóng gói phép tốn số học thao tác số nguyên vào gói byte, word, doubleword )  PADDB/ PADDW/ PADDD: Add packed byte/word/doubleword integers  PSUBB/ PSUBW/ PSUBD: Subtract packed byte/word/doubleword integers  PMULHW / PMULLW: Multiply packed signed word integers and store high/low result  PMADDWD: Multiply and add packed word integers d MMX Comparison Instructions (các lệnh so sánh) So sánh byte, word, doubleword  PCMPEQB Compare packed bytes for equal (so sánh byte)  PCMPEQW Compare packed words for equal (so sánh word)  PCMPEQD Compare packed doublewords for equal(so sánh doubleword) e MMX Logical Instructions (các lệnh logic) Thực thi toán tử logic AND, NOT, OR, XOR toán hạng quadword f MMX Shift and Rotate Instructions (các lệnh dịch quay) Các lệnh dịch quay byte, word, doubleword quadword toán hạng 64-bit  PSLLW/ PSLLD/ PSLLQ : Dịch trái logic word/doubleword/quadword  PSRAW/ PSRAD : Dịch phải số học word/doubleword SSE instructions Là mở rộng kiến trúc đơn dịng lệnh đa liệu(SIMD) với cơng nghệ MMX, SSE thực thi VXL Intel 64 IA-32 mà hỗ trợ mở rộng SSE Thêm 70 lệnh giúp cải thiện hình ảnh, âm video 3D, tiếng nói, chức Internet 32 a SIMD single-precision floating-point instructions that operate on the XMM registers - Thực thi với toán hạng dấu chấm động có độ xác đơn, ghi XMM Nhóm lệnh chia thành nhóm nhỏ hơn:  Các lệnh di chuyển liệu (Data Transfer Instructions) SSE truyền liệu: di chuyển toán hạng dấu chấm động có độ xác đơn ghi XMM ghi XMM với nhớ  Các lệnh số học (Arithmetic Instructions) Thực phép tính số học tốn tử dấu phảy động có độ xác đơn  ADDPS: cộng giá trị số thực dấu phảy động với độ xác đơn  SQRTPS: tính bậc  Các lệnh so sánh (Comparison Instructions) Các lệnh so sánh toán hạng dấu chấm động có độ xác đơn Ví dụ: CMPPS: so sánh giá trị số thực dấu phảy động với độ xác đơn  Các lệnh logic (Logical Instructions) Các lệnh thực thi toán tử AND, OR, NOT, XOR toán hạng dấu chấm động có độ xác đơn  Các lệnh chuyển đổi (Conversion Instructions)  CVTPI2PS: Chuyển số nguyên doubleword thành giá trị dấu chấm động có độ xác đơn b SSE MXCSR State Management Instructions (quản lý MXCSR)  LDMXCSR: tải ghi MXCSR (load MXCSR register)  STMXCSR: Save MXCSR register state Streaming SIMD Extension (SSE2) Instructions Là tập lệnh hỗ trợ đồ họa mở rộng thiết kế cho Pentium Northwood SSE2 có 144 lệnh Các lệnh bao gồm tác vụ số Nguyên SIMD 128-bit 33 (128-bit SIMD integer arithmetic operations) tác vụ dấu chấm động với độ xác kép SIMD 128-bit (128-bit SIMD double-precision floating-point operations) Các lệnh làm tối ưu hóa khả thực hịên ứng dụng phim video, xử lý âm - hình ảnh, mã hóa, tài chính, thiết kế nghiên cứu khoa học, kết nối mạng trực tuyến SSE2 extensions đại diện cho mở rộng mơ hình thực thi SIMD(the SIMD execution model) giới thiệu với công nghệ MMX SSE2 extension, lệnh SSE2 thực gói chứa tốn hạng dấu chấm động với độ xác gấp đơi gói byte, word, doubleword quadword ghi XMM, tập lệnh SSE2 thực VXL hỗ trợ SSE2 extensions c Double-precision floating-point instructions Các lệnh thực tốn hạng số thực dấu chấm động có độ xác kép Bao gồm: Di chuyển liệu: di chuyển liệu dấu chấm động có độ xác kép ghi XMM, ghi XMM nhớ Ví dụ :  MOVAPD: di chuyển hai giá trị dấu chấm động có độ xác đơn ghi XMM ghi XMM nhớ  Số học: thực phép tốn cộng/trừ/nhân/chia/tính bậc 2/min, max giá trị số thực dấu chấm động có độ xác kép  ADDPD: cộng giá trị dấu chấm động có độ xác kép  MULSD: thực phép nhân giá trị dấu chấm động có độ xác kép  So sánh: so sánh giá trị dấu chấm động có độ xác kép  Chuyển đổi  CVTPD2PI: chuyển đổi giá trị số thực dấu chấm động có độ xác đơn sang số nguyên 32 bit  Logic: thực phép tốn logic giá trị số thực có độ xác kép  ANDPD/XOR/NOT/OR: thực hiên phép tốn logic AND/XOR/NOT/OR giá trị số thực có độ xác kép 34  Các lệnh khác (shuffle operations on double-precision floating-point operands)  SHUFPD: Shuffles values in packed double-precision floating-point operands (sắp xếp lẫn lộn toán hạng) d Packed single-precision floating-point conversion instructions(các lệnh chuyển đổi số thực dấu chấm động có độ xác đơn) Thực việc chuyển đổi toán hạng dấu chấm động độ xác đơn số nguyên Những lệnh đại diện cho cải tiến từ tập lệnh tương tự SSE  CVTDQ2PS : chuyển giá trị số nguyên sang số thực dấu chấm động độ xác đơn  CVTPS2DQ: chuyển giá trị dấu chấm động độ xác đơn sang số nguyên SSE3 instructions Được phát triển từ thành công công nghệ MMX (Matrix Math Extensions, mở rộng tính tốn ma trận) từ thời CPU Pentium MMX, SSE (Streaming SIMD Extensions, mở rộng SIMD theo dòng) Intel phát triển tới phiên thứ ba (SSE3) cho CPU Prescott với tên mã Prescott New Instructions (PNI, lệnh Prescott) SIMD viết tắt từ Single Instruction, Multiple Data (một lệnh, nhiều liệu) Đó hoạt động xử lý cách hữu hiệu khối lượng lớn liệu song song với kiến trúc máy tính IA-32 (tức kiến trúc 32-bit) SSE3 với 13 lệnh mở rộng khả SSE2, cải thiện hoạt động công nghệ siêu phân luồng HT cho hiệu hơn, tăng cường chức multimedia Internet cho hệ thống Tập lệnh SSE3 thực VXL IA-32 hỗ trợ phần mở rộng SSE3 35 CPU Prescott có thêm 13 lệnh mới:  lệnh cho tác vụ chuyển đổi floating point to integer: FISTTP  lệnh cho tác vụ tính tốn phức hợp complex arithmetic (tương đương với lệnh ADD/SUB/LOAD/MOVE/DUPLICATE) ADDSUBPS, ADDSUBPD , MOVSHDUP, MOVSLDUP, MOVDDUP  lệnh cho mã hóa video: LDDQU  lệnh cho SIMD-FP dùng định dạng AOS /Array-of- Structures: HADDPS, HSUBPS, HADDPD, HSUBPD  lệnh cho đồng hóa luồng thread synchronisation: o MONITOR: tạo dãy địa để giám sát kho liệu ghi lại o MWAIT: Cho phép xử lý logic nhập vào trạng thái tối ưu chờ đợi kho liệu ghi lại để dãy địa thiết lập lệnh MONITOR 64-bit mode instructions Các lệnh sau giới thiệu với chế độ 64-bit, chế độ phụ IA-32: CDQE: chuyển từ doubleword sang quadword CMPSQ: so sánh xâu MOVSQ: di chuyển quadword từ địa (R)SI tới (R)DI SYSRET: trở từ lời gọi hệ thống nhanh V KẾT LUẬN Intel đưa Pentium nhằm tập trung vào tốc độ xung nhịp cao với thiết kế pipeline dài Tuy cách làm tạo tốc độ cao đồng nghĩa với hiệu suất làm việc lại giảm việc thực lệnh cần nhiều giai đoạn CPU pentium thường có xung nhịp cao CPU AMD, lại không nhanh kiểm nghiệm Benchmark Điều khiến người dùng có khuynh hướng lựa chọn vi xử lí Pentium theo họ vi xử lí có tốc độ cao chạy hiệu hơn, điều khơng phải Trong cơng nghệ HyperThreading (HT) giới thiệu vào giai đoạn Pentium lại thành công khía cạnh … marketing Lợi ích mà HT đem lại thấp (và đơi cịn khơng dùng HT) Trên thực tế, người dùng phổ 36 thông kích hoạt tính “siêu luồng” máy tính desktop mình, họ chẳnng ngoại trừ phải trả giá việc giảm tốc độ tới 10% Tuy nhiên Pentium khơng có nhược điểm Với tập lệnh SSE2 SSE3 công nghệ hàng đầu Quad Data Rate, Trace Cache, Rapid Execution Engine, Dual Channel Memory, Pentium tỏ xuất sắc ứng dụng từ văn phòng tới multimedia Người dùng ứng dụng tính tốn phức tạp (kiểu rendering Maya, 3DS) hưởng lợi nhiều từ HyperThreading Và card đồ họa 3D ngày trở nên mạnh mẽ, chip P4 đem đến tảng tuyệt vời cho game thủ Đặc biệt giới overclock quan tâm tới nhân Northwood phát hành năm 2002 Với bo mạch chủ RAM đủ mạnh, người tập overclock đạt tới GHz sử dụng giải pháp tản nhiệt thông thường 37 38 39 40 41 42 ... Giới thiệu vi xử lý Intel Pentium ……………………………………….….8 II KIẾN TRÚC NETBURST ……………………………………………………11 Sơ đồ khối vi kiến trúc NETBURST ………………………………………11 III KIẾN TRÚC CỦA VI XỬ LÝ INTEL PENTIUM ……………... nhịp, CPU Pentium III nhanh CPU Pentium IV nhờ kích thước pipeline Bởi hiệu pipeline kiến trúc Netburst, hệ vi xử lý thứ Intel (vi kiến trúc Core) quay trở lại với kiến trúc Pentium M, kiến trúc dựa... vi xử lý thi hành loạt lệnh máy báo cho đơn vị xử lý biết phải làm Dựa lệnh, vi xử lý làm vi? ??c sau: - Sử dụng ALU, vi xử lý làm phép tốn cộng, trừ, nhân, chia Các vi xử lý đại bao gồm xử lý dấu

Ngày đăng: 08/07/2015, 15:47

Từ khóa liên quan

Trích đoạn

Tài liệu cùng người dùng

Tài liệu liên quan