R 语言 数据库

  • R 语言 数据库

    数据是关系数据库系统以规范化格式存储的。因此,要进行统计计算,我们将需要非常高级和复杂的Sql查询。但是R可以很容易地连接到许多关系数据库,例如MySql,Oracle,Sql server等,并从它们中获取记录作为数据帧。一旦数据在R环境中可用,它就会变成普通的R数据集,并且可以使用所有强大的软件包和功能来进行操纵或分析。在本教程中,我们将使用MySql作为连接到R的参考数据库。
  • RMySQL包

    R有一个名为“RMySQL”的内置软件包,该软件包提供与MySql数据库之间的本机连接。您可以使用以下命令在R环境中安装此软件包。
    
    install.packages("RMySQL")
    
  • 将R连接到MySql

    安装软件包后,我们将在R中创建一个连接对象以连接到数据库。它以用户名,密码,数据库名称和主机名作为输入。
    
    # Create a connection Object to MySQL database.
    # We will connect to the sampel database named "sakila" that comes with MySql installation.
    mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
       host = 'localhost')
    
    # List the tables available in this database.
     dbListTables(mysqlconnection)
    
    当我们执行以上代码时,它产生以下结果-
    
     [1] "actor"                      "actor_info"                
     [3] "address"                    "category"                  
     [5] "city"                       "country"                   
     [7] "customer"                   "customer_list"             
     [9] "film"                       "film_actor"                
    [11] "film_category"              "film_list"                 
    [13] "film_text"                  "inventory"                 
    [15] "language"                   "nicer_but_slower_film_list"
    [17] "payment"                    "rental"                    
    [19] "sales_by_film_category"     "sales_by_store"            
    [21] "staff"                      "staff_list"                
    [23] "store"   
    
  • 查询表

    我们可以使用dbSendQuery() 函数在MySql中查询数据库表。查询将在MySql中执行,并使用R fetch()函数返回结果集。最后,将其作为数据帧存储在R中。
    
    # Query the "actor" tables to get all the rows.
    result = dbSendQuery(mysqlconnection, "select * from actor")
    
    # Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
    data.frame = fetch(result, n = 5)
    print(data.fame)
    
    当我们执行以上代码时,它产生以下结果-
    
            actor_id   first_name    last_name         last_update
    1        1         PENELOPE      GUINESS           2020-02-15 04:34:33
    2        2         NICK          WAHLBERG          2020-02-15 04:34:33
    3        3         ED            CHASE             2020-02-15 04:34:33
    4        4         JENNIFER      DAVIS             2020-02-15 04:34:33
    5        5         JOHNNY        LOLLOBRIGIDA      2020-02-15 04:34:33
    
  • 用过滤子句查询

    我们可以传递任何有效的选择查询来获取结果。
    
    result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'")
    
    # Fetch all the records(with n = -1) and store it as a data frame.
    data.frame = fetch(result, n = -1)
    print(data)
    
    当我们执行以上代码时,它产生以下结果-
    
            actor_id    first_name     last_name         last_update
    1        18         DAN            TORN              2020-02-15 04:34:33
    2        94         KENNETH        TORN              2020-02-15 04:34:33
    3       102         WALTER         TORN              2020-02-15 04:34:33
    
  • 更新表中的行

    我们可以通过将更新查询传递给dbSendQuery()函数来更新Mysql表中的行。
    
    dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")
    
    执行完上面的代码后,我们可以看到在MySql Environment中更新了该表。
  • 将数据插入表中

    
    dbSendQuery(mysqlconnection,
       "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
       values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
    )
    
    执行完上面的代码后,我们可以看到在MySql Environment中插入表中的行。
  • 在MySql中创建表

    我们可以使用dbWriteTable()函数在MySql中创建表。如果表已经存在,它将覆盖该表,并以数据帧作为输入。
    
    # Create the connection object to the database where we want to create the table.
    mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', 
       host = 'localhost')
    
    # Use the R data frame "mtcars" to create the table in MySql.
    # All the rows of mtcars are taken inot MySql.
    dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)
    
    执行完上面的代码后,我们可以看到在MySql Environment中创建的表。
  • 在MySQL中删除表

    我们可以通过将drop table语句传递到dbSendQuery()中的方式来删除MySql数据库中的表,就像使用它从表中查询数据一样。
    
    dbSendQuery(mysqlconnection, 'drop table if exists mtcars')
    
    执行完上面的代码后,我们可以看到该表已放入MySql环境中。