本篇文章为你整理了1、初识计算机底层(计算机底层技术有哪些)的详细内容,包含有计算机底层原理是什么 计算机底层技术有哪些 计算机底层工作原理 计算机底层技术没人懂了 1、初识计算机底层,希望能帮助你了解 1、初识计算机底层。
CPU的制作过程
Intel cpu的制作过程:https://haokan.baidu.com/v?vid=11928468945249380709 pd=bjh fr=bjhauthor type=video
CPU是如何制作的(文字描述)
https://www.sohu.com/a/255397866_468626
CPU的原理
计算机需要解决的最根本问题:如何代表数字
晶体管是如何工作的:https://haokan.baidu.com/v?vid=16026741635006191272 pd=bjh fr=bjhauthor type=video
晶体管的工作原理:https://www.bilibili.com/video/av47388949?p=2
汇编语言(机器语言)的执行过程
汇编语言的本质:就算机器语言的助记符,其实它就是机器语言
计算机通电 - CPU读取内存中程序(电信号输入)
- 时钟发生器不断震荡通断电:推动CPU内部一步一步执行(执行多少步取决于指令需要的时钟周期)
- 计算完成
- 写回(电信号)
- 写给显卡输出(sout,或者图形)
计算机的组成
CPU的基本组成
PC: Program Counter 程序计数器 (记录当前指令地址)
Registers: 暂时存储CPU计算需要用到的数据
ALU:Arithmetic Logic Unit 运算单元
CU: Control Unit 控制单元
MMU:Memory Management Unit 内存管理单元
cache
缓存一致性协议:https:///z00377750/p/9180644.html
缓存行:
缓存行越大,局部性空间效率越高,但读取时间慢
缓存行越小,局部性空间效率越低,但读取时间快
取一个折中值,目前多用:64字节
测试缓存:Test1 时间比Test2 时间执行大概慢1秒左右
对比一下
public class Test1 {
public static volatile long[] arr = new long[2];
public static void main(String[] args) throws Exception {
Thread t1 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[0] = i;
Thread t2 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[1] = i;
final long start = System.nanoTime();
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println((System.nanoTime() - start)/100_0000);
public class Test2 {
public static volatile long[] arr = new long[16];
public static void main(String[] args) throws Exception {
Thread t1 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[0] = i;
Thread t2 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[8] = i;
final long start = System.nanoTime();
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println((System.nanoTime() - start)/100_0000);
经过测试,Test1类执行时间大概慢于Test2执行时间2秒左右
这是因为缓存行的原因:对于特别敏感的数字,会存在线程竞争的访问,为了保证不发生伪共享,所以使用缓存行对齐的方式。
JDK7中,很多采用long padding提高效率
JDK8,加入了@Contended注解(实验)需要加上:JVM配置项 -XX:-RestrictContended
可以试一下
public class Test1 {
@Contended
public static volatile long[] arr = new long[2];
public static void main(String[] args) throws Exception {
Thread t1 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[0] = i;
Thread t2 = new Thread(()- {
for (long i = 0; i 10_0000_0000L; i++) {
arr[1] = i;
final long start = System.nanoTime();
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println((System.nanoTime() - start)/100_0000);
参考:https://preshing.com/20120515/memory-reordering-caught-in-the-act/
指令重排序的样例:
public class 指令重排序Demo {
private static int x = 0, y = 0;
private static int a = 0, b =0;
public static void main(String[] args) throws InterruptedException {
int i = 0;
for(;;) {
i++;
x = 0; y = 0;
a = 0; b = 0;
Thread one = new Thread(new Runnable() {
@Override
public void run() {
//由于线程one先启动,下面这句话让它等一等线程two. 读着可根据自己电脑的实际性能适当调整等待时间.
//shortWait(100000);
a = 1;
x = b;
Thread other = new Thread(new Runnable() {
@Override
public void run() {
b = 1;
y = a;
one.start();other.start();
one.join();other.join();
String result = "第" + i + "次 (" + x + "," + y + ")";
if(x == 0 y == 0) {
System.err.println(result); // 肯定会有x 和 y 都为0 的时候
break;
} else {
System.out.println(result);
这个测试要花好久时间:
DCL单例为什么要加volatile(Double Check Lock)
如下一个类:
public class T {
int m = 8;
如果要new一个对象:T t = new T();
它是会有一个中间态的,在new这个对象刚开始的时候,会在内存分配一块空间,默认给这个int类型的m 赋值是0,
但如果是多线程情况在这个时候不断地访问,可能会得到m=0 这个值,是不对的,这是因为汇编码的指令是乱序的,所以要禁止指令乱序。
CPU层面怎么禁止指令重排序?
内存屏障。
就是对某部分内存做操作时,前后添加屏障,屏障前后的操作不可以乱序执行。
Intel 使用的是原语
JVM层面怎么禁止指令重排序?
上面所说的是CPU层面的避免指令重排实现,也就是具体的实现,但java程序中是通过JVM的指令去调用CPU底层的
JVM层级:8个hanppens-before原则 4个内存屏障 (LL LS SL SS)
jvm 里面对于内存屏障的实现有4 种
LoadLoad:对于这样的语句Load1;LoadLoad;Load2,在Load2及后续的读操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕;
StoreStore:对于这样的语句Store1;StoreStore;Store2,在Store2及后续的写操作执行前,保证Store1的写入操作对其他处理器可见;
LoadStore:对于这样的语句Load1;LoadStore;Store2,在Store2及后续的写入操作被刷出前,保证Load1要读取的数据被读取完毕;
StoreLoad:对于这样的语句Store1;StoreLoad;Load2,在Load2及后续的读操作要读取的数据被访问前,保证Store1的写入操作对其他处理器可见;
StoreStoreBarrier
volatile 写操作,上下不会乱排
StoreLoadBarrier
LoadLoadBarrier
volatile 读操作,上下不会乱排
LoadStoreBarrier
合并写技术的了解
Write Combining Buffer
一般是4个字节
由于ALU速度太快,所以在写入L1的同时,写入一个WC Buffer,满了之后,再直接更新到L2
NUMA(Non Uniform Memory Access)
在ZGC - NUMA aware ,意思就是分配内存会优先分配该线程所在CPU的最近内存
先了解UMA:说白了多个cpu访问一块内存
再来看NUMA:每个cpu附近有个内存,访问就近的内存比访问别家的内存要快得多
以上就是1、初识计算机底层(计算机底层技术有哪些)的详细内容,想要了解更多 1、初识计算机底层的内容,请持续关注盛行IT软件开发工作室。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。