mysql随机数生成原理?
1) 产生0到1000间的随机数
SELECT RAND() * 10000;
对应产生相应的整数
SELECT FLOOR(RAND() * 10000)
2) 使用md5()产生32位随机字符串
SELECT MD5(RAND() * 10000)
3) 产生500-1000间的整形
SELECT FLOOR( 500 + RAND() * (1000 - 500))
4) 假设某表如下结构
CREATE TABLE fact ( dim1 int, dim2 int, name varchar(20),
hash varchar(32),
measure1 double );
则可以自动产生适合其结构的大量随机记录 create table names(id int auto_increment primary key, name varchar(20));
insert into names (name) values ('Justin','Jerry','James','Josh','Julien');
select (select name from names where id = 1 + rand() * 4);
这里有一个表专门产生随机的字符串;
INSERT INTO fact SELECT FLOOR(1+ rand()*9999), FLOOR(1 + rand()*499), (select name from names where id = 1 + rand() * 4), MD5(1+rand()*9999), rand() FROM fact;
mysql随机io和顺序io区别?
mysql随机io和顺序io的区别在于储存方式不一样:
随机io就是mysql读写的内容分散在磁盘的不同位置,需要来回查找所以效率低;
顺序io就是mysql读写的内容集中存储在磁盘的一块,从前到后依次读取,免去了查找的过程。
所以一般来说顺序io比随机io效率更高。
如何利用SQL随机查询出指定数量的数据?
虽说都是使用 SQL, 但是不同的数据库完成这个操作的写法是不同的, 以50条为例.
MySQL
Select * from [表名] where [条件] order by rand() limit 50
SQL Server
Select top 50 * from [表名] group by [Id] order by NEWID()
MySQL查询select * from table where id in (几百或几千个id) ,如何提高效率?
看了下面各位的回答,有的说用exist,有的说用join,难道你们不是在把简单的事情复杂化了吗?竟然还有子表子查询一说?也有朋友说的很精准,不要用select *,这个*是个坑,实际开发过程中,关于MySQL开发规范也会明确告知大家不要select *。
首先我想问的是:查询MySQL的一张表怎么查最快?当然是根据主键查询了!
默认你的MySQL库、表引擎是Innodb引擎,然后会有一颗主键的B+树,叶子节点就是这个主键索引对应的数据,意味着一次查询即可,回表都不需要好不好?简单直接!
这就是MySQL在Innodb引擎下的聚集索引。
什么是聚集索引?
InnoDB聚集索引的叶子节点存储行记录,因此InnoDB必须要有且只有一个聚集索引。
1.如果表定义了PK(Primary Key,主键),那么PK就是聚集索引。
2.如果表没有定义PK,则第一个NOT NULL UNIQUE的列就是聚集索引。
3.否则InnoDB会另外创建一个隐藏的ROWID作为聚集索引。
这种机制使得基于PK的查询速度非常快,因为直接定位的行记录。
下图是利用普通索引做查询时候的一个回表操作,如何避免回表操作?使用覆盖索引!即select xxx,yyy from table where xxx='' and yyy='',只能查询xxx,yyy就会避免回表操作!
所以你还搞什么其他各种操作来秀呢?只不过题主说了id不是连续的,所以做不到范围查询,也就无法between查询了。
不要纯粹的依赖数据库
如果这个查询量级很大,并发很高,原则上我们是不允许直接查库的,中间必须有一层缓存,比如Redis。那至于这个数据怎么存储到redis就要看具体业务具体分析了。
如果内存足够,甚至可以把这几十万的数据直接放到redis里面去,然后通过redis 的管道查询一次给批量查询出来。
如果没必要存储这么多,或者不让存这么多,是不是可以采用redis的淘汰策略来控制缓存里的数据都是热点数据?