• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 15
    • 下载费用:30 金币  

    重庆时时彩怎么买大小: 数值控制装置.pdf

    关 键 词:
    数值 控制 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201610753450.7

    申请日:

    2016.08.29

    公开号:

    CN106483934A

    公开日:

    2017.03.08

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效 IPC(主分类):G05B 19/4155申请日:20160829|||公开
    IPC分类号: G05B19/4155 主分类号: G05B19/4155
    申请人: 发那科株式会社
    发明人: 弦间荣治
    地址: 日本山梨县
    优先权: 2015.08.27 JP 2015-167634
    专利代理机构: 北京银龙知识产权代理有限公司 11243 代理人: 范胜杰;曹鑫
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610753450.7

    授权公告号:

    ||||||

    法律状态公告日:

    2018.06.15|||2017.08.01|||2017.03.08

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明涉及数值控制装置,其具备机械学习器,该机械学习器对机床的加工条件的调整进行机械学习。该机械学习器根据获取到的与被加工物的加工状态有关的数据来计算回报,并且根据机械学习结果和与加工状态有关的数据来决定加工条件的调整量,根据该调整量来调整加工条件。并且,根据所决定的加工条件的调整量、与加工状态有关的数据以及回报,对加工条件的调整进行机械学习。

    权利要求书

    1.一种数值控制装置,按照程序指令对机床的主轴转速、进给速度、刀具与工件的位置
    中的某一个或全部进行控制来加工工件,其特征在于,
    上述数值控制装置具备机械学习器,其对上述加工中的加工条件的调整对象参数以及
    该调整对象参数的调整量进行机械学习,
    上述机械学习器具有:
    状态观测部,其取得表示上述加工中的加工状态的信息即状态数据;
    回报条件存储部,其存储回报条件;
    回报计算部,其根据上述状态数据和上述回报条件来计算回报;
    加工条件调整学习部,其对加工条件调整进行机械学习;以及
    加工条件调整部,其根据上述加工条件调整学习部的上述加工条件调整的机械学习结
    果以及上述状态数据,将加工条件调整的对象参数及其调整量决定为调整行为,根据该调
    整行为调整上述加工中的加工条件,
    上述加工条件调整学习部构成为,根据上述调整行为、基于所输出的调整后的上述加
    工条件的加工动作后的通过上述状态观测部取得的上述状态数据、以及由上述回报计算部
    计算出的上述回报,对上述加工条件调整进行机械学习。
    2.根据权利要求1所述的数值控制装置,其特征在于,
    上述状态数据包括加工中的主轴转速、进给速度、切削量、机械振动即颤振、颤振音、刀
    具磨损/损坏状态、加工面的状况中的某一个。
    3.根据权利要求1所述的数值控制装置,其特征在于,
    上述加工条件调整的对象参数包括主轴转速和进给速度中的至少一个。
    4.根据权利要求1所述的数值控制装置,其特征在于,
    上述数值控制装置还具备学习结果存储部,其存储由上述加工条件调整学习部学习而
    得的结果,
    上述加工条件调整部构成为,根据由上述加工条件调整学习部学习而得的加工条件调
    整的学习结果以及存储在上述学习结果存储部中的加工条件调整的学习结果来调整加工
    条件。
    5.根据权利要求1所述的数值控制装置,其特征在于,
    上述回报条件在上述刀具沿刀具路径快速地行进时或工件加工面的质量为预定的基
    准值以上的情况下赋予正的回报,另一方面,
    在产生机械振动即颤振、颤振音时或产生刀具磨损、刀具损坏时或工件的加工面的质
    量为预定的基准值以下的情况下赋予负的回报。
    6.根据权利要求1所述的数值控制装置,其特征在于,
    上述数值控制装置与至少一个其它数值控制装置连接,
    在与上述其它数值控制装置之间相互交换或共享机械学习的结果。
    7.根据权利要求1所述的数值控制装置,其特征在于,
    上述机械学习使用以自变量来表现上述状态数据和加工条件调整的评价函数来进行
    学习,使得上述回报变为最大。
    8.一种机械学习器,对通过数值控制装置控制的机床中的加工工件时的加工条件的调
    整进行机械学习,其特征在于,
    上述机械学习器具备:
    学习结果存储部,其存储上述加工条件的调整的机械学习结果;
    状态观测部,其取得表示上述加工中的加工状态的信息即状态数据;以及
    加工条件调整部,其根据存储在上述学习结果存储部中的上述加工条件的调整的机械
    学习结果以及上述状态数据,将加工条件调整的对象参数及其调整量决定为调整行为,根
    据该调整行为来调整上述加工中的加工条件。

    说明书

    数值控制装置

    技术领域

    本发明涉及一种数值控制装置,特别涉及一种具有抑制产生颤振或刀具磨损/损
    坏的加工条件调整功能的数值控制装置。

    背景技术

    在通过机床使用刀具进行加工的情况下,控制该机床的控制装置对进行程序指示
    的路径、速度、主轴转速进行指示。此时,根据指令在加工时产生颤振、刀具磨损/刀具折损,
    有时对加工面带来不良影响。在加工中产生了颤振、刀具磨损/刀具折损的情况下,作业人
    员对主轴转速、进给速度进行调整,寻找不会产生颤振、刀具磨损/刀具折损的加工条件。

    在日本特开平04-311206号公报中公开了以下异?;乇芸刂品椒ǎ涸诩庸ぶ懈?br />传感器数据进行监视,在产生了机械振动、刀具损坏等异常的情况下确定其原因,在预先设
    定的范围内在与通常的加工条件不同的加工条件下进行加工,根据所确定的原因进行加工
    程序的修正,以便成为不会发生异常的加工条件。

    然而,存在以下问题:为了选定不产生颤振、刀具磨损/刀具折损的最佳加工条件,
    需要相当丰富的经验,根据作业人员的技能不同,加工条件的调整费时。另外,还存在不产
    生颤振、刀具磨损/刀具折损的加工条件的选定非常困难的加工状况。在这种情况下,即使
    作业人员进行反复尝试有时也找不出适当的加工条件。

    针对该问题,在上述日本特开平04-311206号公报中记载了使得成为不会发生异
    常的加工条件这一情况,但是并没有示出为此具体如何调整加工条件为好的相关技术方
    法。

    发明内容

    因此,本发明的目的在于提供一种具有抑制颤振、刀具磨损/刀具折损的加工条件
    调整功能的数值控制装置。

    本发明的数值控制装置按照程序指令对机床的主轴转速、进给速度、刀具与工件
    的位置中的某一个或全部进行控制来加工工件,具备机械学习器,其对上述加工中的加工
    条件的调整对象参数以及该调整对象参数的调整量进行机械学习。而且,该机械学习器具
    有:状态观测部,其取得表示上述加工中的加工状态的信息即状态数据;回报条件存储部,
    其存储回报条件;回报计算部,其根据上述状态数据和上述回报条件来计算回报;加工条件
    调整学习部,其对加工条件调整进行机械学习;以及加工条件调整部,其根据上述加工条件
    调整学习部的上述加工条件调整的机械学习结果以及上述状态数据,将加工条件调整的对
    象参数及其调整量决定为调整行为,根据该调整行为来调整上述加工中的加工条件。上述
    加工条件调整学习部构成为,根据上述调整行为、基于所输出的调整后的上述加工条件的
    加工动作后的通过上述状态观测部取得的上述状态数据、以及由上述回报计算部计算出的
    上述回报,对上述加工条件调整进行机械学习。

    上述状态数据可以包括加工中的主轴转速、进给速度、切削量、机械振动即颤振、
    颤振音、刀具磨损/损坏状态、加工面的状况中的某一个。

    上述加工条件调整的对象参数可以包括主轴转速和进给速度中的至少一个。

    上述数值控制装置可以还具备学习结果存储部,其存储由上述加工条件调整学习
    部学习而得的结果,上述加工条件调整部构成为,根据由上述加工条件调整学习部学习而
    得的加工条件调整的学习结果以及存储在上述学习结果存储部中的加工条件调整的学习
    结果来调整加工条件。

    上述回报条件可以在上述刀具沿刀具路径快速地行进时或工件加工面的质量为
    预定的基准值以上的情况下赋予正的回报,另一方面,在产生机械振动即颤振、颤振音时或
    产生刀具磨损、刀具损坏时或工件的加工面的质量为预定的基准值以下的情况下赋予负的
    回报。

    上述数值控制装置可以与至少一个其它数值控制装置进行连接,在与上述其它数
    值控制装置之间相互交换或共享机械学习的结果。

    上述机械学习可以使用以自变量来表现上述状态数据和加工条件调整的评价函
    数来进行学习,使得上述回报变为最大。

    本发明的机械学习器对通过数值控制装置控制的机床中的加工工件时的加工条
    件的调整进行机械学习,具备:学习结果存储部,其存储上述加工条件的调整的机械学习结
    果;状态观测部,其取得表示上述加工中的加工状态的信息即状态数据;以及加工条件调整
    部,其根据存储在上述学习结果存储部中的上述加工条件的调整的机械学习结果以及上述
    状态数据,将加工条件调整的对象参数及其调整量决定为调整行为,根据该调整行为来调
    整上述加工中的加工条件。

    在本发明中,通过机械学习调整为不会产生颤振、刀具磨损/刀具折损的加工条
    件,由此能够防止向加工面的不良影响等并提高加工的稳定性。

    附图说明

    通过参照附图的以下的实施例的说明,能够更加明确本发明的上述以及其它目的
    以及特征。在这些图中:

    图1是说明强化学习算法的基本概念的图。

    图2是与本发明的一个实施方式的数值控制装置的机械学习有关的图。

    图3是表示图2的数值控制装置的功能的框图。

    图4是说明图3的数值控制装置的加工条件调整学习部所进行的机械学习的流程
    的流程图。

    具体实施方式

    在本发明中,通过向对加工工件的机床进行控制的数值控制装置导入成为人工智
    能的机械学习器,进行与针对从机床获取的主轴转速、进给速度、切削量、机械振动(颤振)、
    颤振音、刀具磨损/损坏状态、加工面的状况等与加工状态有关的数据的加工条件的调整有
    关的机械学习,由此进行调整使得加工条件与加工状态对应地成为最佳条件。

    以下,简单地说明导入到本发明的数值控制装置的机械学习。

    [1.机械学习]

    通常,在机械学习中,有教师学习(supervised learning)、无教师学习
    (unsupervised learning)等根据其目的、条件分类为各种算法。在本发明中,以对加工工
    件的机床进行控制的数值控制装置中的加工条件的调整学习为目的,考虑到难以明确地示
    出针对从机床获取的主轴转速、进给速度、切削量、机械振动(颤振)、颤振音、刀具磨损/损
    坏状态、加工面的状况等加工状态进行什么样的行为(加工条件的调整)是正确的,采用仅
    通过赋予回报而使机械学习器自动地学习用于到达目标的行为的强化学习算法。

    使用图1说明强化学习算法的基本概念。

    在强化学习中,通过成为学习的主体的智能体(机械学习器)与成为控制对象的环
    境(控制对象系统)进行交换,推进智能体学习与行为。更具体地说,在智能体与环境之间进
    行以下交换:

    (1)智能体观测某一时间点的环境的状态st,

    (2)根据该观测结果和过去的学习来选择自己所采取的行为at并执行行为at,

    (3)通过执行该行为at,环境的状态st向下一状态st+1变化,

    (4)智能体根据作为行为at的结果的状态的变化来取得回报rt+1,

    (5)智能体根据状态st、行为at、回报rt+1以及过去的学习结果来推进学习。

    在上述(5)的学习中,作为用于判断将来能够获取的回报的量的基准信息,智能体
    获取观测到的状态st、行为at、回报rt+1的映射。例如当将各时刻获取的状态的个数设为m、将
    获取的行为的个数设为n时,通过反复进行行为来得到将对应于状态st与行为at的组的回报
    rt+1进行存储的m×n的二维数组。

    而且,使用根据上述得到的映射而表示当前的状态、行为好到什么程度的函数即
    价值函数(评价函数),通过在反复进行行为的过程中更新价值函数(评价函数),不断学习
    对应于状态的最佳行为。

    状态价值函数为表示某一状态st为好到什么程度的状态的价值函数,表现为以状
    态为自变量的函数,在反复行为的过程中的学习中,根据对某一状态下的行为得到的回报、
    通过该行为而变化的未来的状态的价值等进行更新。根据强化学习的算法来定义状态价值
    函数的更新式,例如在作为强化学习算法之一的TD学习中,状态价值函数用以下式(1)来定
    义。此外,在式(1)中,α为学习系数,γ为折扣率,在0<α≤1、0<γ≤1的范围内对它们进行定
    义。

    V(st)←V(st)+α[rt+1+γV(st+1)-V(st)]……(1)

    另外,行为价值函数为表示在某一状态st下行为at为好到什么程度的行为的价值
    函数,表现为将状态和行为设为自变量的函数,在反复行为的过程中的学习中,根据对某一
    状态下的行为得到的回报、通过该行为而变化的未来状态下的行为的价值等进行更新。行
    为价值函数的更新式根据强化学习的算法而定义,例如在作为代表性强化学习算法之一的
    Q学习中,行为价值函数用以下式(2)来定义。此外,在式(2)中,α为学习系数,γ为折扣率,
    在0<α≤1、0<γ≤1的范围内对它们进行定义。


    此外,在存储作为学习结果的价值函数(评价函数)的方法中,除了使用近似函数
    的方法、使用数组的方法以外,也存在使用例如在状态s取很多状态的情况下将状态st、行
    为at作为输入而输出价值(评价)的多值输出的SVM、神经网络等有教师学习器的方法等。

    而且,在上述(2)中的行为的选择中,使用通过过去的学习而制作的价值函数(评
    价函数),在当前的状态st下选择将来的回报(rt+1+rt+2+…)变得最大的行为at(在使用状态
    价值函数的情况下,选择用于变化为价值最高的状态的行为,在使用行为价值函数的情况
    下,选择在该状态下价值最高的行为)。此外,在智能体的学习中,以学习的进展为目的,有
    时在(2)中的行为的选择中以一定的概率来选择随机的行为(ε贪婪算法)。

    这样,通过重复(1)~(5)来推进学习。在某一环境下结束学习之后,智能体放置在
    新的环境的情况下也进行追加的学习,由此能够以适应于该环境的方式推进学习。因而,如
    本发明那样在对加工工件的机床进行控制的数值控制装置中的加工条件的调整中应用机
    械学习,由此即使在新的机床的控制中应用机械学习的情况下,通过在过去的加工条件的
    调整学习中进行新环境中的追加学习,也能够在短时间内进行加工条件的调整学习。

    另外,在强化学习中,设为将多个智能体经由网络等进行连接的系统,在智能体之
    间共享状态s、行为a、回报r等信息并用于各自的学习,由此,各智能体进行还考虑其它智能
    体的环境来进行学习的分散强化学习(distributed reinforcement learning),由此能够
    进行高效的学习。在本发明中,在控制多个环境(数值控制装置)的多个智能体(机械学习
    器)经由网络等进行连接的状态下进行分散机械学习,由此,能够高效地进行对加工工件的
    机床进行控制的数值控制装置中的加工条件的调整学习。

    此外,作为强化学习的算法,Q学习、SARSA法、TD学习、AC法等各种方法是公知的,
    作为应用于本发明的强化学习的算法也可以是这些方法中的任一方法。上述强化学习算法
    的方法均为公知的,所以在此省略更详细的说明。

    以下,根据具体的实施方式说明导入了机械学习器的本发明的数值控制装置。

    [2.实施方式]

    使用图2说明本发明的一个实施方式中导入了机械学习器的数值控制装置中的加
    工条件的调整的机械学习。此外,在图2中仅示出本实施方式的对机床进行控制的数值控制
    装置中的机械学习的说明所需的结构。

    在本实施方式中,机械学习器20作为用于确定环境(在“[1.机械学习]”中说明的
    状态st)的信息,输入了机床中进行加工时的主轴转速、进给速度、切削量等指令值以及机
    械振动、颤振音、刀具磨损/损坏状态、加工面的状况等加工信息。这些各值为从机床1的各
    部获取的数据以及从数值控制装置10获取的数据。

    在本实施方式中,作为机械学习器20向环境的输出(在“[1.机械学习]”中说明的
    行为at),将机床中进行加工时的主轴转速、进给速度等加工条件的调整设为输出数据。

    另外,在本实施方式中,作为对机械学习器20赋予的回报(在“[1.机械学习]”中说
    明的回报rt),采用加工速度的提高(正回报)、颤振的产生(负回报)、刀具磨损/损坏的产生
    (负回报)、加工面的质量(正回报、负回报)等。此外,也可以由作业人员适当地设定根据哪
    一种数据来决定回报。

    并且,在本实施方式中,机械学习器20根据上述输入数据、输出数据以及回报进行
    机械学习。在机械学习中,在某一时刻t,根据输入数据的组合来定义状态st,对所定义的状
    态st进行的加工条件的调整成为行为at,而且,根据通过该行为at进行加工条件的调整的结
    果而新得到的输入数据来评价计算出的值成为回报rt+1,如在“[1.机械学习]”中说明那样,
    将该状态st、行为at、回报rt+1适用于与机械学习的算法相应的价值函数(评价函数)的更新
    式,由此推进学习。

    在此,以下使用图3的功能框图说明图2的数值控制装置10的功能。

    对机床1进行控制的数值控制装置10对从存储器(未图示)读出的程序11进行分
    析,根据作为其分析结果而得到的控制数据对机床1进行控制来加工工件?;?分别具备
    传感器(未图示),该传感器检测在加工时产生的机械振动(振动传感器)、颤振音(声音传感
    器)、刀具磨损/损坏状态(摄像传感器)以及加工面的状况(摄像传感器)。数值控制装置10
    构成为能够经由这些传感器来获取表示加工状态的加工信息。

    数值控制装置10具备:加工信息获取部12,其从机床1的各部获取加工信息等数
    据;加工条件变更部13,其对主轴转速、进给速度的超驰值进行变更等来变更加工条件;以
    及机械学习器20,其成为进行机械学习的人工智能。此外,机床1、数值控制装置10具备一般
    的机床、数值控制装置的结构,省略在本发明的机械学习的动作说明中特别需要的结构以
    外的结构的详细说明。

    当将图3示出的数值控制装置10的结构与图1示出的强化学习中的要素进行对比
    时,图3的机械学习器20与图1的智能体对应,另外,除了图3的机械学习器20以外的机床1和
    数值控制装置10所具备的各结构与图1的环境对应。

    进行机械学习的机械学习器20具备状态观测部21、状态数据存储部22、回报条件
    存储部23、回报计算部24、加工条件调整学习部25、学习结果存储部26以及加工条件调整部
    27?;笛捌?0既可以如图3所示设置于数值控制装置10内,也可以设置于数值控制装置
    10外的个人计算机等中。

    状态观测部21将从作为数值控制装置10的程序11的分析结果而得到的控制数据
    获取到的主轴转速、进给速度、切削量等的指令值以及由加工信息获取部12获取到的机床1
    的加工信息,作为与加工状态有关的数据而进行观测,在机械学习器20内获取。

    状态数据存储部22输入并存储与加工状态有关的数据,将所存储的与加工状态有
    关的数据输出到回报计算部24、加工条件调整学习部25。所输入的与加工状态有关的数据,
    既可以是在最新的加工运转中获取到的数据,也可以是在过去的加工运转中获取到的数
    据。另外,还能够将存储在其它数值控制装置40、集中管理系统30中的与加工状态有关的数
    据进行输入并存储或输出。

    回报条件存储部23存储赋予由作业人员等设定的机械学习中的回报的条件。在该
    回报中存在正的回报和负的回报,能够适当地进行设定。向回报条件存储部23的输入也可
    以是来自在集中管理系统30中使用的个人计算机、平板终端等,能够经由数值控制装置10
    所具备的MDI设备(未图示)来输入,由此能够更简单地进行设定。

    回报计算部24根据在回报条件存储部23中设定的条件,对从状态观测部21或状态
    数据存储部22输入的与加工状态有关的数据进行分析,将计算出的回报输出到加工条件调
    整学习部25。

    以下,示出本实施方式的回报条件存储部23中设定的回报条件的示例。

    ·[回报1:加工速度的提高(正回报)]

    在工件的加工速度通过前一次的加工条件的调整(时刻t-1的加工条件的调整)而
    提高了的情况下,根据其程度来赋予正的回报。

    ·[回报2:颤振的产生(负回报)]

    在机床1中加工工件时,在产生预先设定的预定基准值以上的机械振动、预先设定
    的预定基准值以上的颤振音的情况下,根据其程度赋予负的回报。各预定基准值也可以预
    先设定于回报条件存储部23中。

    ·[回报3:刀具磨损/损坏的产生(负回报)]

    在机床1中加工工件时,在刀具磨损发展到预先设定的预定基准值以上的情况下,
    根据其程度赋予负的回报。另外,在产生了刀具损坏的情况下,赋予负的回报。各预定基准
    值也可以预先设定于回报条件存储部23中。

    ·[回报4:加工面的质量(正回报、负回报)]

    在机床1中在前一次的加工条件的调整(时刻t-1的加工条件的调整)后加工的工
    件的加工面的质量好到预先设定的预定基准值以上的情况下,根据其程度赋予正的回报,
    相反地在为预定基准值以下的情况下,根据其程度赋予负的回报。关于质量评价,例如以从
    程序11假设的理想的加工面为基准,根据加工后的加工面与其偏离多少(加工精度)等来评
    价即可。

    加工条件调整学习部25根据包括输入数据等的与加工状态有关的数据、加工条件
    调整学习部25本身所进行的加工条件的调整结果以及由回报计算部24计算出的回报来进
    行机械学习(强化学习)。

    在此,在加工条件调整学习部25所进行的机械学习中,根据某一时刻t的与加工状
    态有关的数据的组合来定义状态st,根据该定义的状态st来决定加工条件的调整量这一情
    况成为行为at。而且,通过后述的加工条件调整部27来进行加工条件的调整,其调整结果被
    输出到加工条件变更部13,然后,根据调整的各加工条件来控制机床1进行工件的加工,由
    上述回报计算部24根据作为加工结果而得到的数据所计算出的值成为回报rt+1。

    根据所应用的学习算法来决定用于学习的价值函数。例如在使用Q学习的情况下,
    按照上述式(2)来更新行为价值函数Q(st、at),由此推进学习即可。

    使用图4的流程图说明加工条件调整学习部25进行的机械学习的流程。以下,按照
    各步骤进行说明。

    [步骤SA01]当开始机械学习时,状态观测部21获取与机床1的加工状态有关的数
    据。

    [步骤SA02]加工条件调整学习部25根据由状态观测部21获取到的与加工状态有
    关的数据来确定当前的状态St。

    [步骤SA03]加工条件调整学习部25根据过去的学习结果以及在步骤SA02中确定
    的状态St来选择行为at(加工条件的调整)。

    [步骤SA04]执行在步骤SA03中选择的行为at。

    [步骤SA05]状态观测部21获取表示机床1的状态的与加工状态有关的数据。在该
    阶段,机床1的状态随着从时刻t向时刻t+1的时间推移并根据在步骤SA04中执行的行为at
    而发生变化。

    [步骤SA06]回报计算部24根据在步骤SA05中获取的评价结果的数据来计算回报
    rt+1。

    [步骤SA07]加工条件调整学习部25根据在步骤SA02中确定的状态St、在步骤SA03
    中选择的行为at以及在步骤SA06中计算的回报rt+1来推进机械学习,返回至步骤SA02。

    返回至图3,学习结果存储部26存储由加工条件调整学习部25学习的结果。另外,
    在加工条件调整学习部25再次使用学习结果时,将所存储的学习结果输出到加工条件调整
    学习部25。在学习结果的存储中,如上所述,通过近似函数、数组或多值输出的SVM、神经网
    络等有教师学习器等来存储与所使用的机械学习算法对应的价值函数即可。

    此外,还能够在学习结果存储部26中输入并存储由其它数值控制装置40、集中管
    理系统30存储的学习结果,或将由学习结果存储部26存储的学习结果输出到其它数值控制
    装置40、集中管理系统30。

    加工条件调整部27根据由加工条件调整学习部25学习的结果和与当前的加工状
    态有关的数据来决定加工条件的调整量。在此所指的加工条件的调整量的决定,相当于使
    用于机械学习的‘行为a’。加工条件的调整,例如也可以将构成加工条件的各参数的项目与
    变更量进行组合而得到的结果,作为可选择的行为(例如,行为1=主轴转速超驰+10%、行
    为2=进给速度超驰-10%、…)而准备,根据过去的学习结果来选择将来得到的回报变得最
    大的行为。也可以将可选择的行为设为将多个加工条件的项目同时进行调整的行为。另外,
    也可以采用上述ε贪婪算法,以预定的概率来选择随机的行为,由此实现加工条件调整学习
    部25的学习进展。

    之后,加工条件调整部27根据所决定的加工条件的调整量,对加工条件变更部13
    进行指示来调整数值控制装置10中的加工条件。然后,根据由加工条件调整部27调整后的
    加工条件,数值控制装置10对机床1进行控制。

    之后,再次由机械学习器20获取当前的机床1的状况,使用所输入的与加工状态有
    关的数据来反复进行学习,由此能够得到更佳的学习结果。

    这样,作为由机械学习器20学习的结果,在基于数值控制装置10的机床1中加工工
    件时进行与加工状态相应的加工条件的调整的阶段,机械学习器20的学习完成。

    在使用完成上述学习的学习数据来实际控制机床的数值控制装置中进行加工时,
    机械学习器20也可以不进行新的学习,而数值控制装置直接使用学习完成时的学习数据来
    使机床反复进行运转。

    另外,也可以将完成学习的机械学习器20(或将其它机械学习器20所完成的学习
    数据复制到学习结果存储部26的机械学习器20)安装于其它数值控制装置40,数值控制装
    置直接使用学习完成时的学习数据使机床反复进行运转。

    并且,将完成学习的机械学习器20在使其学习功能保持有效的状态下安装于其它
    数值控制装置40而控制机床来使工件的加工持续,由此还能够进一步学习根据每个机床而
    不同的个体差、经年变化等,一边探索对于该机床各自来说更佳的加工条件的调整,一边运
    转。

    数值控制装置10的机械学习器20也可以单独地进行机械学习,但是如果多个数值
    控制装置10还分别具备与外部的通信单元,则能够发送接收由各自的状态数据存储部22存
    储的与加工状态有关的数据、由学习结果存储部26存储的学习结果来共享,能够更高效率
    地进行机械学习。例如在预定范围内使加工条件改变来进行学习时,在多个数值控制装置
    10中在预定范围内分别使不同调整量改变来进行加工,同时在各数值控制装置10之间交换
    与加工状态有关的数据、学习数据,由此并行地推进学习,从而能够高效地进行学习。

    这样在多个数值控制装置10之间进行交换时,通信既可以经由集中管理系统30等
    主计算机,也可以直接在数值控制装置10之间进行通信,也可以使用云端来进行,但是由于
    有时对大量数据进行处理,因此优选使用通信速度尽可能快的通信单元。

    以上,说明了本发明的实施方式,但是本发明并不仅限于上述实施方式的示例,通
    过加以适当的变更,能够以各种方式来实施。

    关于本文
    本文标题:数值控制装置.pdf
    链接地址://www.4mum.com.cn/p-6004664.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 标准六码三期计划 自动看文章赚钱 飞艇官方彩平台 快乐彩12选5计算公式 北京塞车开奖结果 四川时时 钱流通赚钱 亿乐棋牌游戏 沉迷于赚钱累并快乐着图片 最新大乐透中奖规则表 青海十一选五一定牛 开游乐场赚钱 重庆老时时开奖视频 腾讯分分彩必赢计划app 跑马精准计划 脉动棋牌手机版下载