[go: up one dir, main page]

CN110086591B - 一种大规模天线系统中的导频污染抑制方法 - Google Patents

一种大规模天线系统中的导频污染抑制方法 Download PDF

Info

Publication number
CN110086591B
CN110086591B CN201910399212.4A CN201910399212A CN110086591B CN 110086591 B CN110086591 B CN 110086591B CN 201910399212 A CN201910399212 A CN 201910399212A CN 110086591 B CN110086591 B CN 110086591B
Authority
CN
China
Prior art keywords
pilot frequency
pilot
optimization problem
algorithm
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910399212.4A
Other languages
English (en)
Other versions
CN110086591A (zh
Inventor
朱禹涛
洪军华
连永进
胡志明
刘泽民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yingtan Taier Internet Of Things Research Center
Original Assignee
Yingtan Taier Internet Of Things Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yingtan Taier Internet Of Things Research Center filed Critical Yingtan Taier Internet Of Things Research Center
Priority to CN201910399212.4A priority Critical patent/CN110086591B/zh
Publication of CN110086591A publication Critical patent/CN110086591A/zh
Application granted granted Critical
Publication of CN110086591B publication Critical patent/CN110086591B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/003Arrangements for allocating sub-channels of the transmission path
    • H04L5/0048Allocation of pilot signals, i.e. of signals known to the receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/26TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service]
    • H04W52/267TPC being performed according to specific parameters using transmission rate or quality of service QoS [Quality of Service] taking into account the information rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/30Transmission power control [TPC] using constraints in the total amount of available transmission power
    • H04W52/32TPC of broadcast or control channels
    • H04W52/325Power control of control or pilot channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. Transmission Power Control [TPC] or power classes
    • H04W52/04Transmission power control [TPC]
    • H04W52/38TPC being performed in particular situations
    • H04W52/42TPC being performed in particular situations in systems with time, space, frequency or polarisation diversity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0426Power distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请公开了一种大规模天线系统中的导频污染抑制方法,涉及无线通信技术领域。本申请的主要技术方案为为优化目标建立最优化问题模型;将最优化问题模型分解为导频分配子模型和功率控制子模型;循环迭代导频分配子模型和功率控制子模型的求解算法,得到最优化问题模型的近似最优解,确定抑制导频污染的导频分配和功率控制。采用本申请提供的导频污染的抑制方法,提高了大规模天线系统用户上行和速率,有效地抑制了导频污染问题。

Description

一种大规模天线系统中的导频污染抑制方法
技术领域
本申请涉及无线通信技术领域,尤其涉及一种大规模天线系统中的导频污染抑制方法。
背景技术
随着无线通信网络的发展和物联网、机器对机器通信、电子学习、电子银行等新兴业务的出现,移动用户和移动设备数量快速增加,对移动数据流量的需求呈现爆炸式增长。预计未来十年各种新兴业务对移动流量的需求将比目前的需求增加数千个数量级,与现有无线网络相比,需要具有更高容量的新技术。虽然传统多输入多输出技术通过增加基站端和用户端的天线数量来提高系统的可靠性和有效性。然而传统多天线系统的基站天线数量较少,系统的性能远不能满足未来社会对高数据速率的新兴业务需求。大规模天线系统是一种新的通信系统,其中具有几百个天线阵列的基站(BS)在相同的时频资源中同时服务于多个用户终端(UE),每个用户终端具有单个或多个天线,具有多个天线的基站同时向多个终端发送独立的数据流。
研究表明,大规模天线系统通过利用其阵列增益支持更多用户的空间复用传输,可以大幅度地提高系统的频谱效率和能量效率。并且,当基站端的天线数趋向于无穷大时,多用户多小区大规模天线系统会呈现出许多优良的特性:不同用户间的信道向量趋于正交,相同小区内用户间的干扰趋近于零;系统中不相关噪声的影响逐渐消失,信道的小尺度衰落被平均化。
在大规模天线系统中,准确的信道状态信息估计至关重要,否则将严重影响上下行链路的通信质量,目前信道状态信息获取主要分为两类:基于导频的信道估计和基于子空间的信道估计。大规模天线系统采用常见的块衰落模型,信道状态信息可以认为在一段相干时间内保持不变,超过了相干时间间隔则需要重新进行信道估计。基于子空间的信道估计方式误码率较高,并且进行一次信道估计的时间较长,远大于系统的信道相干时间,所以利用正交的导频序列进行信道估计是目前获取信道状态信息的主要方式,而正交导频序列受到信道相干时间的限制,数量非常有限,不能满足日益增长的移动用户数目,所以大规模天线系统中小区内用户需要发送相同或非正交的导频训练序列进行信道估计,导致用户受到使用相同导频或非正交导频用户的干扰,这一现象称为导频污染。
对导频进行随机分配会导致小区间的用户复用非正交导频会带来干扰,影响准确的信道估计。合理的导频分配是有效抑制导频污染的方法之一。基于导频分配的导频污染抑制研究大多默认各个用户上行导频传输功率相同,只考虑不同的导频分配方案对导频污染的抑制效果,然而不同的导频传输功率控制方案也会对系统吞吐量造成影响。已有部分研究从导频功率控制的角度提出抑制大规模天线系统导频污染的方法,但是多为启发式设计,没有给出导频功率控制对系统性能增益的上限。
发明内容
本申请提供一种大规模天线系统中的导频污染抑制方法,其特征在于,包括:为优化目标建立最优化问题模型;将最优化问题模型分解为导频分配子模型和功率控制子模型;循环迭代导频分配子模型和功率控制子模型的求解算法,得到最优化问题模型的近似最优解,确定抑制导频污染的最优导频分配和功率控制。
如上的,其中,为优化目标建模,得到最优化问题模型为:
Figure BDA0002059177910000021
其中,i的取值为1~L,表示大规模天线系统中的第i个小区,L为小区总数;k的取值为1~K,表示小区内的第k个用户终端,K为小区内的用户终端的总数量;
Figure BDA0002059177910000022
为导频分配方式,
Figure BDA0002059177910000023
代表所有(K!)L种导频分配方案,s表示导频集,共包括k个正交导频;pik表示第i个小区基站中第k个用户终端的上行导频发射功率,pjk′表示第j个小区中第k′个用户终端的上行导频发射功率,p={pik}L×K为所有用户的上行导频发射功率构成的L行K列的矩阵;
Figure BDA0002059177910000024
hiik表示第i个小区中第k个用户终端的信号增益,
Figure BDA0002059177910000025
为hiik的共轭转置;
Figure BDA0002059177910000026
hijk′表示第j个小区中第k′个用户终端到第i个小区基站的信道增益,
Figure BDA0002059177910000027
为hijk′的共轭转置;
Figure BDA0002059177910000028
βijk为大尺度衰落因子,gijk为小尺度衰落因子,
Figure BDA0002059177910000029
表示复数集合,
Figure BDA00020591779100000210
表示M+1维的复向量;cik表示第i个小区中第k个用户终端使用的导频序列,cjk′表示第j个小区中第k′个用户终端使用的导频序列;σ2为高斯白噪声的标准差。
如上的,其中,当大规模天线系统中的天线数增多时,根据大规模天线系统的特性,将小尺度衰落因子忽略不计,将优化目标的最优化问题模型简化为:
Figure BDA0002059177910000031
其中,s.t.表示该简化的最优化问题模型受限于0<pik≤Pmax,Pmax表示用户上行链路的最大发射功率。
如上的,其中,功率控制子模型的求解算法采用连续凸近似算法,得到凸近似问题如下:
Figure BDA0002059177910000032
其中,p为所有用户的上行导频发射功率构成的矩阵;aik表示
Figure BDA0002059177910000033
bik表示
Figure BDA0002059177910000034
如上的,其中,在采用连续凸近似算法求解过程中通过迭代方法最大化收紧原优化目标的下界,具体包括如下子步骤:
依据初始化用户功率获得最优化问题的值;
循环求解优化问题,当优化问题的解满足设定条件时,输出第t次的功率分配结果p(t),即优化问题的最优解以及最优解对应的最优化问题的值。
如上的,其中,循环求解优化问题输出优化问题的最优解,具体为:在计算完优化问题的初始解Φ[0]后,t自加1,若计算
Figure BDA0002059177910000035
则t继续自加1,再次求解该优化问题,得到第t次的功率分配结果p(t),返回继续比较
Figure BDA0002059177910000036
与ε,直至
Figure BDA0002059177910000041
输出计算得到的功率分配结果。
如上的,其中,导频分配子模型的求解算法采用基于分布式Q学习的导频分配算法,结合Q学习算法对导频分配子问题进行建模,具体包括:
虚拟智能体:将大规模天线系统中的L个小区基站作为虚拟智能体;
动作:每个智能体都有一个动作集合A,第i个智能体动作
Figure BDA0002059177910000042
其中
Figure BDA0002059177910000043
是第i个小区中每个用户的导频分配,每个智能体的动作有K!个,K为小区中用户终端总数量;
状态:将由L个六边形蜂窝小区组成的时分双工多小区多用户大规模天线系统作为与智能体进行交互的环境,每个智能体都有各自的状态向量,代表每个小区中用户导频分配状态;
奖惩信号:智能体选择动作作用于环境,环境通过奖惩信号影响智能体的学习过程,将智能体的回报函数定为大规模天线系统基站选取某种导频分配方案后理想状态中的系统和速率;智能体根据回报函数更新各自的Q值表,在Q表更新之后,各智能体需要利用ε贪婪策略进行动作选择,以概率ε在动作空间中随机选择动作向量,或者以概率1-ε的概率选择动作。
如上的,其中,导频分配子模型的求解算法采用基于分布式Q学习的导频分配算法,具体包括如下子步骤:
初始化导频、功率、智能体动作集和Q值表;
依次遍历每个智能体:
若为每个智能体生成的随机数小于概率ε,则从智能体动作集中为该智能体任意选择一个动作;若为每个智能体生成的随机数大于或等于概率ε,根据Q值表选择动作ai,执行动作向量ai,遍历每个智能体i,根据状态和上次动作获取回报函数,根据回报函数更新Q值表。
如上的,其中,根据导频分配子模型和功率控制子模型的求解算法构造联合功率控制和导频分配的导频污染抑制主算法,获得用于系统和速率最大化问题的次优联合导频分配和功率控制解决方法,具体包括如下子步骤:
初始化各个用户终端的功率为等功率分配;
根据用户终端的功率计算系统和速率的值,当第i+1次系统和速率的值与第i次结果差值大于或等于误差值ε时,依次交替迭代基于分布式Q学习的导频分配算法和连续凸近似算法;当第i+1次系统和速率的值与第i次结果差值小于误差值ε时,结束迭代过程,算法结束。
如上的,其中,依次交替迭代基于分布式Q学习的导频分配算法和连续凸近似算法,具体为:设定误差值ε,当第i+1次系统和速率的值与第i次结果差值小于ε,或i=0时,循环执行操作:根据基于分布式Q学习的导频分配算法和p(i-1)获得a(i),再根据连续凸近似算法和a(i)获得p(i),更新R(i);直至第i+1次系统和速率的值与第i次结果差值大于或等于ε。
本申请实现的有益效果如下:采用本申请提供的导频污染的抑制方法,提高了大规模天线系统用户上行和速率,有效地抑制了导频污染问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为大规模天线模型示意图;
图2为本申请实施例提供的导频污染抑制方法流程图;
图3为基于分布式Q学习的导频分配算法流程图;
图4为凸优化问题求解过程中为收紧原优化目标下界而采用的迭代方法流程图;
图5为联合功率控制和导频分配的导频污染抑制算法流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请先对大规模天线模型进行描述,如图1所示,在多小区多用户大规模天线系统(MIMO系统)中,每个小区包含有一个配置了M根天线的基站和K个单天线用户终端(UE),基站位于小区中心,单天线用户终端在小区内均匀分布,M根天线与K个单天线用户终端之间具有互易性,即在单一激励的情况下,当激励端口和响应端口互换位置时,响应不因这种互换而有所改变。
由于导频数量受到信道相干时间的限制,所以无法为所有用户分配正交的导频训练序列;在本申请实施例中,设定同一小区中的用户发射相互正交的导频,不同小区的用户复用同一套导频集。在导频分配的基础上,为了进一步抑制导频污染,以最大化系统用户上行和速率为目标,考虑导频传输功率对大规模天线系统性能的影响,尽可能提高大规模天线系统的上行传输和效率,本申请提出了一种联合功率控制和导频分配的导频污染抑制方法。
实施例一
如图2所示,所述导频污染抑制方法包括:
步骤110、为优化目标建立最优化问题模型;
为优化目标建模,得到如下所示的最优化问题模型:
Figure BDA0002059177910000061
在公式(1)中,i的取值为1~L,表示大规模天线系统中的第i个小区,L为小区总数;k的取值为1~K,表示小区内的第k个用户终端,K为小区内的用户终端的总数量;
Figure BDA0002059177910000062
为导频分配方式,
Figure BDA0002059177910000063
代表所有(K!)L种导频分配方案,s表示导频集,共包括k个正交导频;pik表示第i个小区基站中第k个用户终端的上行导频发射功率,pjk′表示第j个小区中第k′个用户终端的上行导频发射功率,p={pik}L×K为所有用户的上行导频发射功率构成的L行K列的矩阵;
Figure BDA0002059177910000064
hiik表示第i个小区中第k个用户终端的信号增益,
Figure BDA0002059177910000065
为hiik的共轭转置;
Figure BDA0002059177910000066
hijk′表示第j个小区中第k′个用户终端到第i个小区基站的信道增益,
Figure BDA0002059177910000067
为hijk′的共轭转置;
Figure BDA0002059177910000068
βijk为大尺度衰落因子,gijk为小尺度衰落因子,
Figure BDA0002059177910000069
表示复数集合,
Figure BDA00020591779100000610
表示M+1维的复向量;cik表示第i个小区中第k个用户终端使用的导频序列,cjk′表示第j个小区中第k′个用户终端使用的导频序列;σ2为高斯白噪声的标准差;
当大规模天线系统中的天线数逐渐增多时,根据大规模天线系统的特性,小尺度衰落因子gijk被平均化,约等于0,忽略不计,将优化目标的最优化问题模型简化为:
Figure BDA00020591779100000611
在公式(2)中,“s.t.”指subject to,表示公式(2)受限制于0<pik≤Pmax,Pmax表示用户上行链路的最大发射功率,且cik属于导频集s;
由公式(2)可知,在正交导频集和上行链路最大发射功率的限制下,优化目标不仅与导频分配方式
Figure BDA0002059177910000071
有关,也受每个用户的上行传输功率p影响;大规模天线系统的系统和速率(即系统中所有用户的上行速率之和)表示为包含导频分配方式
Figure BDA0002059177910000072
和功率p两个变量的函数
Figure BDA0002059177910000073
Figure BDA0002059177910000074
根据导频分配方式
Figure BDA0002059177910000075
和功率p的函数
Figure BDA0002059177910000076
将最优化问题模型简化为:
Figure BDA0002059177910000077
在公式(4)中,“s.t.”指subject to,表示公式(2)受限制于0<pik≤Pmax,Pmax表示用户上行链路的最大发射功率;
Figure BDA0002059177910000078
为全称量词,表示任意小区中的任意用户终端。
返回参见图1,步骤120、将最优化问题模型分解为导频分配子模型和功率控制子模型;
由于优化目标建模得到的最优化问题模型为
Figure BDA0002059177910000079
和p的组合集合,属于组合优化问题,无法获得联合问题的最优解,因此,本申请将最优化问题模型分解为导频分配子模型和功率控制子模型,将原优化问题分解为导频分配子问题和功率控制子问题进行处理。
步骤130、循环迭代导频分配算法和功率控制算法,得到最优问题模型的近似最优解,确定抑制导频污染的导频分配和功率控制。
具体地,通过给定用户功率分配的情况下,优化导频分配子问题,并通过给定导频分配的情况下,优化功率控制子问题,然后将两个子问题的求解算法进行循环迭代,获得最优化问题模型的近似最优解,得到可以有效抑制导频污染的导频分配和功率控制方案。
导频分配子模型:
具体地,在给定用户功率分配的情况下,优选利用基于分布式Q学习的导频分配算法求解导频分配子问题,具体包括:将导频分配子问题转化为L个并行的基站联合利用多智能体Q学习算法求解最优导频分配方案问题;
需要说明的是,多智能体Q学习算法分为集中式Q学习和分布式Q学习两种;集中式Q学习将所有参加学习的智能体动作统一维护,对该问题而言,联合动作总量也就是穷举后的分配方案数量,导致算法复杂度过高,学习过程可能无法实现。因此在此问题中,本申请优选采用以各个基站为智能体的分布式Q学习算法。
在本申请采用的分布式Q学习的过程中,每个基站维护各自的Q值表,结合Q学习算法的五大要素对导频分配子问题进行建模:
虚拟智能体:将大规模天线系统中的L个小区基站作为虚拟智能体;
动作:每个智能体都有一个动作集合
Figure BDA0002059177910000081
第i个智能体动作
Figure BDA0002059177910000082
其中
Figure BDA0002059177910000083
是第i个小区中每个用户的导频分配,所有L个智能体的动作之和构成优化目标中的解空间
Figure BDA0002059177910000084
状态:将由L个六边形蜂窝小区组成的TDD(Time Division Duplexing,时分双工)多小区多用户大规模天线系统作为与智能体进行交互的环境,每个智能体都有各自的状态向量,第i个智能体的状态向量为
Figure BDA0002059177910000085
代表每个小区中用户导频分配状态;
奖惩信号:智能体选择动作作用于环境,环境通过奖惩信号影响智能体的学习过程,即基站选择某个导频分配方案对MIMO系统产生了作用,根据该作用是否对系统造成正面影响对基站的此次选择进行反馈,进而影响基站下一次的导频分配方案选择;为了实现系统上行和速率最大化,智能体需要在某个状态下采取一定动作后的系统上行和速率,具体为:
在时刻t时,智能体基站i感知到当前MIMO系统环境处在导频分配状态s,该基站选取相应的动作
Figure BDA0002059177910000086
对本小区内的用户进行导频分配,该动作对系统的上行和速率产生影响,环境状态从s变为s′,并向智能体基站i反馈回报函数
Figure BDA0002059177910000087
st表示t时刻下当前系统的状态,
Figure BDA0002059177910000088
表示t时刻下智能体i做出的动作,
Figure BDA0002059177910000089
表示第i个智能体在t时刻下的回报函数;
考虑到不同智能体之间的互相影响,回报函数由各个智能体协同动作决定,因此将第i个智能体在t时刻下状态st时选用动作
Figure BDA00020591779100000810
的回报函数
Figure BDA00020591779100000811
定为基站i在t时刻选取某种导频分配方案后理想状态中的系统和速率,如下式所示:
Figure BDA00020591779100000812
在Q学习过程中,智能体根据回报函数更新各自的Q值表,当t+1时刻,新的Q值大于之前t时刻的Q值时,Q值表进行更新,否则不发生变化,Q值计算如下式所示;
Figure BDA0002059177910000091
在公式(6)中,Qi t+1(s,ai)为t+1时刻的Q值,Qi t(s,ai)为t时刻的Q值;α∈(0,1],表示学习速率,用于衡量Q学习收敛的速度,当α取值较小时,学习耗时较大,反之,算法可能会不收敛;γ为折扣因子,代表回报函数值的衰减程度;
Figure BDA0002059177910000092
表示t时刻Q值最大的动作,s′i,a′i是第i个智能体t时刻的状态和动作选择,A是智能体所有可能采取的动作的有限集合,即各个基站可以采用的导频分配方案,本申请优选设置不同智能体的有限集合相同;
在Q表更新之后,各智能体利用ε贪婪策略进行动作选择,以概率ε在动作空间中随机选择动作向量,或者以概率1-ε的概率选择动作ai
Figure BDA0002059177910000093
ε为[0,1]的随机数,一般情况取0.1;在此过程中智能体i不断优化动作选择策略,该策略代表环境与动作的映射关系,不同的环境状态对应不同的动作选择。
如图3所示,基于分布式Q学习的导频分配算法,具体包括:
步骤210:初始化导频、功率、智能体动作集和Q值表;
具体地,定义每个小区中每个用户终端的导频为cik、功率为pik,并规定每个智能体的动作集,初始化Q值表,使每个智能体的Qi(si,ai)=0。
步骤220:依次遍历每个智能体,并判断为每个智能体生成的随机数是否小于概率ε,如果是,则从智能体动作集中为该智能体任意选择一个动作,否则执行步骤230:
定义每个智能体为i,为第i个智能体产生随机数ξi∈[0,1],若(ξi<ε),则从智能体动作集中为第i个智能体任意选择一个动作,若(ξi≥ε),则执行步骤230。
步骤230:根据Q值表选择动作ai,执行动作向量ai
定义智能体i在t时刻的Q值为Qt(si,ai),根据计算得到的Q值更新Q值表,当第i个智能体产生的随机数(ξi≥ε)时,从Q值表中选择动作
Figure BDA0002059177910000094
并执行动作向量ai
步骤240:遍历每个智能体i,根据状态和上次动作获取回报函数Ri(si,ai),根据回报函数更新Q值表Qi t+1(si,ai)。
本申请采用基于多智能体Q学习的导频分配算法大大降低了算法复杂度,考虑到不同智能体之间的互相影响,回报函数目标由各个智能体协同动作决定,即导频分配子问题的优化目标。
功率控制子模型:
具体地,在给定导频分配方式的情况下,由于优化目标为对数形式,因此优选利用连续凸近似(SCA)算法对目标函数进行转化;对于任意非负数γ和γ0,满足下式:
log(1+γ)≥f(γ,a,b)=alog(γ)+b (7)
其中,对于特定值γ0
Figure BDA0002059177910000101
f(γ,a,b)为以γ,a,b为自变量的函数,即:
Figure BDA0002059177910000102
在公式(8)中,当γ=γ0时取等号,式(8)为以γ为变量的一元函数,通过移项求导证明该不等式成立。令
Figure BDA0002059177910000103
对该式求导可得
Figure BDA0002059177910000104
当γ>γ0时f(γ)递增,当γ<γ0时,f(γ)递减,当γ=γ0时f(γ)取得极小值0,所以不等式成立。
因此,
Figure BDA0002059177910000105
在公式(9)中,
Figure BDA0002059177910000106
aik表示
Figure BDA0002059177910000107
bik表示
Figure BDA0002059177910000108
根据上述凸性近似,使用速率下界近似方法,将优化目标近似为如下优化问题:
Figure BDA0002059177910000109
推导得到的公式(10)为凸优化问题,利用标准的凸优化工具(如cvx工具)直接求解;需要说明的是,虽然通过连续凸近似方法将优化问题转化为凸优化问题,求解出近似优化问题,但如公式(10)的近似问题仅仅是最大化原优化目标的下界,因此为了进一步提高结果的准确性,在求解过程中通过迭代方式尽可能收紧原优化目标的下界,具体包括,如图4所示:
步骤310:依据初始化用户功率获得最优化问题的值;
本申请采用基于SCA的功率控制算法,输入导频分配方案cik,定义每个用户终端到各个基站的大尺度衰落因子βijk;定义每个用户的功率pik=Pmax,初始化t=0,定义初始化时优化问题解为p(0),记Φ[0]为优化问题的解p(0)所对应的最优化问题的值。
步骤320:循环求解优化问题,当优化问题的解满足设定条件时,输出第t次的功率分配结果p(t),即优化问题的最优解,以及最优解所对应的最优化问题的值Φ[t]。
t自加1,求解该优化问题,得到第t次的功率分配结果p(t)与Φ[t];若计算
Figure BDA0002059177910000111
则t继续自加1,再次求解该优化问题,得到第t次的功率分配结果p(t),返回继续比较
Figure BDA0002059177910000112
与ε,直至
Figure BDA0002059177910000113
输出计算得到的功率分配结果。
本申请将优化问题分解为两个子问题,得到基于分布式Q学习的导频分配算法和连续凸近似(SCA)算法,根据上述两个算法构造主算法,即联合功率控制和导频分配的导频污染抑制算法,获得用于系统和速率最大化问题的次优联合导频分配和功率控制解决方法,具体包括,如图5所示:
步骤410:初始化各个用户终端的功率;
具体地,将p(0)初始化为等功率分配,定义i=0,R(0)=0;
步骤420:根据用户终端的功率计算系统和速率的值,当第i+1次系统和速率的值与第i次结果差值大于或等于误差值ε时,依次交替迭代基于分布式Q学习的导频分配算法和连续凸近似(SCA)算法;
其中,利用基于分布式Q学习的导频分配算法进行导频分配,在导频分配基础上利用连续凸近似(SCA)算法进行功率分配,在该功率分配的基础上再次进行导频分配,依次进行交替迭代,具体为设定误差值ε,当第i+1次系统和速率的值与第i次结果差值小于ε,或i=0时,循环执行操作:根据基于分布式Q学习的导频分配算法和p(i-1)获得a(i),再根据连续凸近似(SCA)算法和a(i)获得p(i),更新R(i);直至第i+1次系统和速率的值与第i次结果差值大于或等于ε。
步骤430:当第i+1次系统和速率的值与第i次结果差值小于误差值ε时,结束迭代过程,算法结束。
本申请实现的有益效果如下:
(1)采用本申请提供的导频污染的抑制方法,提高了大规模天线系统用户上行和速率,有效地抑制了导频污染问题;
(2)本申请采用对最优化目标建模及对该目标的拆分,实现对无法直接求得最优解的组合优化问题进行分解,获得优化目标的近似最优方案;
(3)利用多智能体分布式Q学习方法进行求解导频分配子问题,将优化问题映射到Q学习过程中,大大降低了算法复杂度,而且考虑到不同智能体之间的互相影响,回报函数目标由各个智能体协同动作决定,得到导频分配子问题的优化目标。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (3)

1.一种大规模天线系统中的导频污染抑制方法,其特征在于,包括:
为优化目标建立最优化问题模型;
将最优化问题模型分解为导频分配子模型和功率控制子模型;
循环迭代导频分配子模型和功率控制子模型的求解算法,得到最优化问题模型的近似最优解,确定抑制导频污染的最优导频分配和功率控制;
功率控制子模型的求解算法采用连续凸近似算法,得到凸近似问题如下:
Figure FDA0003264391930000011
s.t.0<pik≤Pmax
其中,p为所有用户的上行导频发射功率构成的矩阵;i的取值为1~L,表示大规模天线系统中的第i个小区,L为小区总数;k的取值为1~K,表示小区内的第k个用户终端,K为小区内的用户终端的总数量;aik表示
Figure FDA0003264391930000012
bik表示
Figure FDA0003264391930000013
pik表示第i个小区基站中第k个用户终端的上行导频发射功率,Pmax表示用户上行链路的最大发射功率;pjk′表示第j个小区中第k′个用户终端的上行导频发射功率;cik表示第i个小区中第k个用户终端使用的导频序列,cjk′表示第j个小区中第k′个用户终端使用的导频序列;σ2为高斯白噪声的标准差;
在采用连续凸近似算法求解过程中通过迭代方法最大化收紧原优化目标的下界,具体包括如下子步骤:
依据初始化用户功率获得最优化问题的值;
循环求解优化问题,当优化问题的解满足设定条件时,输出第t次的功率分配结果p(t),即优化问题的最优解以及最优解对应的最优化问题的值;
循环求解优化问题输出优化问题的最优解,具体为:在计算完优化问题的初始解Φ[0]后,t自加1,若计算
Figure FDA0003264391930000021
则t继续自加1,再次求解该优化问题,得到第t次的功率分配结果p(t),返回继续比较
Figure FDA0003264391930000022
与ε,直至
Figure FDA0003264391930000023
输出计算得到的功率分配结果;
导频分配子模型的求解算法采用基于分布式Q学习的导频分配算法,结合Q学习算法对导频分配子问题进行建模,具体包括:
虚拟智能体:将大规模天线系统中的L个小区基站作为虚拟智能体;
动作:每个智能体都有一个动作集合A,第i个智能体动作
Figure FDA0003264391930000024
其中
Figure FDA0003264391930000025
是第i个小区中每个用户的导频分配,每个智能体的动作有K!个,K为小区中用户终端总数量;
状态:将由L个六边形蜂窝小区组成的时分双工多小区多用户大规模天线系统作为与智能体进行交互的环境,每个智能体都有各自的状态向量,代表每个小区中用户导频分配状态;
奖惩信号:智能体选择动作作用于环境,环境通过奖惩信号影响智能体的学习过程,将智能体的回报函数定为大规模天线系统基站选取某种导频分配方案后理想状态中的系统和速率;智能体根据回报函数更新各自的Q值表,在Q表更新之后,各智能体需要利用ε贪婪策略进行动作选择,以概率ε在动作空间中随机选择动作向量,或者以概率1-ε的概率选择动作;
导频分配子模型的求解算法采用基于分布式Q学习的导频分配算法,具体包括如下子步骤:
初始化导频、功率、智能体动作集和Q值表;
依次遍历每个智能体:
若为每个智能体生成的随机数小于概率ε,则从智能体动作集中为该智能体任意选择一个动作;若为每个智能体生成的随机数大于或等于概率ε,根据Q值表选择动作ai,执行动作向量ai,遍历每个智能体i,根据状态和上次动作获取回报函数,根据回报函数更新Q值表;
根据导频分配子模型和功率控制子模型的求解算法构造联合功率控制和导频分配的导频污染抑制主算法,获得用于系统和速率最大化问题的次优联合导频分配和功率控制解决方法,具体包括如下子步骤:
初始化各个用户终端的功率为等功率分配;
根据用户终端的功率计算系统和速率的值,当第i+1次系统和速率的值与第i次结果差值大于或等于误差值ε时,依次交替迭代基于分布式Q学习的导频分配算法和连续凸近似算法;当第i+1次系统和速率的值与第i次结果差值小于误差值ε时,结束迭代过程,算法结束;
依次交替迭代基于分布式Q学习的导频分配算法和连续凸近似算法,具体为:设定误差值ε,当第i+1次系统和速率的值与第i次结果差值小于ε,或i=0时,循环执行操作:根据基于分布式Q学习的导频分配算法和p(i-1)获得a(i),再根据连续凸近似算法和a(i)获得p(i),更新R(i);直至第i+1次系统和速率的值与第i次结果差值大于或等于ε。
2.根据权利要求1所述的大规模天线系统中的导频污染抑制方法,其特征在于,为优化目标建模,得到最优化问题模型为:
Figure FDA0003264391930000031
其中,
Figure FDA0003264391930000032
为导频分配方式,
Figure FDA0003264391930000033
代表所有(K!)L种导频分配方案,s表示导频集,共包括k个正交导频;p={pik}L×K为所有用户的上行导频发射功率构成的L行K列的矩阵;
Figure FDA0003264391930000034
hiik表示第i个小区中第k个用户终端的信号增益,
Figure FDA0003264391930000035
为hiik的共轭转置;
Figure FDA0003264391930000036
hijk′表示第j个小区中第k′个用户终端到第i个小区基站的信道增益,
Figure FDA0003264391930000037
为hijk′的共轭转置;
Figure FDA0003264391930000038
Figure FDA0003264391930000039
表示复数集合,
Figure FDA00032643919300000310
表示M+1维的复向量。
3.根据权利要求2所述的大规模天线系统中的导频污染抑制方法,其特征在于,当大规模天线系统中的天线数增多时,根据大规模天线系统的特性,将小尺度衰落因子忽略不计,将优化目标的最优化问题模型简化为:
Figure FDA00032643919300000311
s.t.0<pik≤Pmax;cik∈s
其中,s.t.表示该简化的最优化问题模型受限于0<pik≤Pmax
CN201910399212.4A 2019-05-14 2019-05-14 一种大规模天线系统中的导频污染抑制方法 Active CN110086591B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910399212.4A CN110086591B (zh) 2019-05-14 2019-05-14 一种大规模天线系统中的导频污染抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910399212.4A CN110086591B (zh) 2019-05-14 2019-05-14 一种大规模天线系统中的导频污染抑制方法

Publications (2)

Publication Number Publication Date
CN110086591A CN110086591A (zh) 2019-08-02
CN110086591B true CN110086591B (zh) 2021-10-22

Family

ID=67420050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910399212.4A Active CN110086591B (zh) 2019-05-14 2019-05-14 一种大规模天线系统中的导频污染抑制方法

Country Status (1)

Country Link
CN (1) CN110086591B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113193945B (zh) * 2021-05-07 2022-08-02 中山大学 导频与功率分配联合优化方法、系统、介质及通信设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012105278A (ja) * 2002-10-25 2012-05-31 Qualcomm Inc 複数のシンボル長を使用する多重キャリア送信
CN104009947A (zh) * 2014-06-19 2014-08-27 华中科技大学 一种导频信号发送和信道估计方法
CN104243121A (zh) * 2014-09-11 2014-12-24 西安交通大学 一种Massive MIMO系统中的基于小区扇区化的导频分配方法
CN104270820A (zh) * 2014-08-04 2015-01-07 西安交通大学 3d大规模mimo系统中联合的垂直波束控制及功率分配方法
CN104378813A (zh) * 2008-01-30 2015-02-25 高通股份有限公司 用于在无线网络中减轻导频污染的方法和装置
CN109151975A (zh) * 2018-07-27 2019-01-04 北京工业大学 一种时分双工大规模mimo系统的联合动态导频和数据功率分配方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012105278A (ja) * 2002-10-25 2012-05-31 Qualcomm Inc 複数のシンボル長を使用する多重キャリア送信
CN104378813A (zh) * 2008-01-30 2015-02-25 高通股份有限公司 用于在无线网络中减轻导频污染的方法和装置
CN104009947A (zh) * 2014-06-19 2014-08-27 华中科技大学 一种导频信号发送和信道估计方法
CN104270820A (zh) * 2014-08-04 2015-01-07 西安交通大学 3d大规模mimo系统中联合的垂直波束控制及功率分配方法
CN104243121A (zh) * 2014-09-11 2014-12-24 西安交通大学 一种Massive MIMO系统中的基于小区扇区化的导频分配方法
CN109151975A (zh) * 2018-07-27 2019-01-04 北京工业大学 一种时分双工大规模mimo系统的联合动态导频和数据功率分配方法

Also Published As

Publication number Publication date
CN110086591A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
Xia et al. A deep learning framework for optimization of MISO downlink beamforming
Zaher et al. Learning-based downlink power allocation in cell-free massive MIMO systems
Cheng et al. Optimal pilot and payload power control in single-cell massive MIMO systems
CN103763782B (zh) 一种mu‑mimo下行链路基于加权用户相关的公平调度方法
CN106992805A (zh) 多天线传输方法、基站和用户终端
CN101557611A (zh) 一种用于多天线系统的下行多用户的选择方法
CN102111352B (zh) 多点协作联合发送网络中的信息反馈方法、装置和系统
Li et al. IRS-based MEC for delay-constrained QoS over RF-powered 6G mobile wireless networks
Dong et al. Improved joint antenna selection and user scheduling for massive MIMO systems
CN101997653B (zh) 虚拟多输入多输出系统中的用户设备配对方法和基站
CN107947841B (zh) 大规模mimo非正交多址系统多天线用户对调度方法
CN109995496B (zh) 一种大规模天线系统的导频分配方法
CN110086591B (zh) 一种大规模天线系统中的导频污染抑制方法
CN109039963B (zh) 一种多小区mu-miso系统中的部分迫零预编码方法
CN111917444B (zh) 一种适用于毫米波mimo-noma系统的资源分配方法
CN106972878A (zh) 一种数据处理方法和装置
CN105611640B (zh) 一种公平度可调的CoMP下行用户调度方法
Khan et al. Joint power control and pilot assignment in cell-free massive MIMO using deep learning
CN103457699B (zh) 一种用于协作多点传输系统的基站端信干噪比估计方法
CN114710187B (zh) 一种用户数动态变换场景下多小区大规模mimo智能通信的功率分配方法
CN108282201B (zh) 一种用户终端调度方法及装置、通信系统
CN113242064B (zh) 基于用户空域特征和信道预测的多小区调度方法
Nwalozie et al. Distributed Coordinated Beamforming for RIS-aided Dynamic TDD Systems
CN110445519B (zh) 基于信干噪比约束的抗组间干扰方法及装置
Chung et al. Semidynamic cell-clustering algorithm based on reinforcement learning in cooperative transmission system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant